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Peptides ayant des proprietes immunologiques de HIV- 2 





La presente invention est relative a des pep- 
tides ayant des proprietes immunologiques, le cas 
echeant immunogenes, en commun avec des antigenes sus- 
ceptibles d'etre obtenus sous une forme purifiee, a 

partir de virus capables de pxovoquex des lymphadeno- 

* 

pathies susceptibles d'etre relayees ensuite par le 
symdrome d* immunodeficience acquise CSIDA) chez l'homme. 

L ' invention concexne en particulier des pep- 
tides antigAniques susceptibles d'etre reconnus par des 

anticorps induits chez l'homme pax des virus designes 

#> 

par l'abreviation HIV, selon - la nomenclature definie 
dans NATURE. Elle concerne egalement des peptides ayant 
des proprietes immunogenes ou susceptibles d'etre rendus 
immunogenes in vivo . cette immunogenicite etant suscep- 
tible de se manif ester par 1' induction in vivo d' anti- 


25 
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virus HIV-2 et meme, au moins en ce qui concerne 
certains de ces peptides, des antigenes issus de HIV-1. 

L ' invention concerne en outre des applications 
de ces peptides A la fabrication de compositions pour le 
diagnostic in vitro chez l'homme de potentialite de cer- 
taines formes du SIDA et, en ce qui concerne certains 
d’entre eux, a la production de compositions immunogenes 

et de compositions vaccinantes contre les retrovirus 
HIV. 

De meme 1 * invention concerne les applications 
aux mAmes fins des anticorps susceptibles d'etre induits 
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in vivo par les peptides immunogenes ou rendus immuno- 
genes et, pour certains de ces anticorps, leurs applica- 
tions a : la production de principes actif s de medicaments 
centre ces SIDAS humains . 

L' invention concerne egalement la mise en 
oeuvre de certains de ces peptides dans des procedes 
pour le . diagnostic iji vitro chez 1 1 homme de certaines 
formes ‘ du SIDA, airisi que leur application a la consti- 
tution de trousses ou "kits" de diagnostic. 

Un premier retrovirus denomme LAV-1 ou HIV-1 a 
ete isole et deer it dans la demande de brevet 

GB. 83/24, 800 et une demande EP. 84/401 - 834 du 14/09/84. 
Ce virus a egalement ete decrit par F.Barre Sinoussi et 
al. dans Science, 220 n* 45^99, 20 pages 868-871. 

Des* variants de ce virus HIV-1 designes par 

* * - - 1 

LAV ELI. et LAV MAL, ont egalement ete isoles, caracte- 

” , * . , ■ T ' * 

rises et decrits dans la demande de brevet EP.84/- 


401.834. 

* j 

Les virus HIV-1 et leurs variants possedent 
les proprietes suivantes : 

- ils ont : pour cibles pref 4rencielles les 
cellules Leu3 (ou lymphocytes T4) humaines et leurs 
cellules derivees M immor tails ees 11 . 


- ils ont une activate transcriptase inverse 

2 + 

necessitaat la presence d'ions Mg et presentent une 
forte . activite pour le polyCadenylate-oligo-deoxythymi- 
dylase) po ly ( A > -ol igo ( dT ) 12-18) 

- ils ont une densite de 1,16 a 1,17 sur 


- ils ont un diam&tre moyen de 139 nanometres 
et un noyau de diamdtre moyen de 41 nanometres, 

- les lysats de ces virus contiennent une 
proteine p25 (proteine du noyau) qui ne croise pas Im- 
munol ogiquement avec la proteine p24 de HTLV-1, 

- ils contiennent une proteine p42 appartenant 
a leur enveloppe. 
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ils contiennent egalement une glycoproteine 
d'enveloppe gpllO d'un poids moleculaire de 110.000. 

L’isolement et la caracterisation de retro- 
virus appartenant a une classe distincte et n'ayant 

qu'une parente immunologique reduite avec les prece- 
5 

dents, ont ete decrits dans la demande de brevet euro- 

peen n* 87/400.151.4. Ces retrovirus qui ont ete regrou- 

pes sous la designation HIV-2, ont ete isoles chez plu- 

sieurs malades africains presentant des symptomes d'une 

lymphadenopathie ou d'un SIDA. 

Les retrovirus du type HIV-2 comme les retro- 

* 

virus du type HIV-1, se caracterisent par un tropisme 

pour les lymphocytes T4 humains et par un effet cyto- 

pathogene a 1 ' egard de ces lymphocytes, lorsqu'ils s'y 

_ multiplient , ■ pour alors causer soit des pdly-adenopa- 
15 

thies generalisees et persistantes , soit un SIDA. 

Plus generalement les retrovirus purifies par 
HIV-2 possedent en general les proprietes suivantes : 

- la cible pref erentielle des retrovirus HIV-2 est cons- 
tituee par les cellules Leu3 (ou lymphocytes T4) humai- 

mm v 

nes et pour des cellules “ immortalisees" derivees de ces 


25 




lymphocytes T4 ; 

- ils sont cytotoxiques pour les lymphocytes T4 humains 

ils ont une activite de transcriptase inverse neces- 

2 + 

sitant la presence d'ions Mg et presentant une forte 
activite pour le poly (adenylate-oligodeoxythylmidylase) 
(poly(A)-oligo(dT) 12-18) ; 

ils ont une density de 1,16 dans un gradient de 
sucrose ; 

- ils ont un diametre moyen de 140 nanometres et un 
noyau ayant un diametre moyen de 41 nanometres ; 

- ils peuvent etre cultivds dans des lignees permanentes 
du type HUT ou exprimant la proteine T4 ; 

- ils ne sont pas infectieux pour les lymphocytes T8 ; 

- les lysats de ces virus contiennent une proteine p26 
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- qui ne croise pas immunologiquement avec la proteine p24 
du virus HTDV-I ou du virus HTLV-II ; 

ces lysats contiennent en outre une proteine pi 6 qui 
n'est pas reconnue immunologiquement par la proteine pi 9 
^ de HTtiV-I ou de HTIrV-II dans des essais de radioimmuno- 
precipitation ; 

^ 1 r , * 

- ils contiennent en outre une glycoproteine d'enveloppe 
ayant un poids moleculaire de l'ordre de 130.000-140.000 
qui ne croise pas immunologiquement avec la gpllO des 
HXV-t, mais qui en revanche croise immunologiquement 
avec la glycoproteine d’enveloppe gp140 de STLV-III (vi- 

i * * 

rus isole chez le singe) ; 

- ces lysats contiennent encore des antigenes marquables 

35 

par la S-cysteine , dont les poids moleculaires s 1 eta- 

* 

ij. gent entre 32*. 000 et 42.000-45.000 : ils comprennent no- 
tamment un antigene ayant un poids moleculaire de l*or- 

t v T 

dre de 36.000 et. un , antigene ayant un poids moleculaire 
de l'ordre de 42. 000 , I'un de ces antigenes (p36 et p42) 

. constituant vraisemblablement. . une glycoproteine trans- 
2 q membranaire du virus HIV - 2 ; 

I'ARN gdnomique des HIV-2 n*hybride pas avec 1 r ARN 
genomique de HIV-1 dans des conditions stringentes ; 

- dans des conditions non stringentes, l'ARN genomique 
de HIV-2 n’hybride, hi avec le gene env - et le LTR qui le 

25 jouxte, de HIV-1 , ni avec des sequences de la region pol 

& * T 

du gdnome de HIV- 1 ; 

- dans des conditions non stringentes, il hybride fai- 
blement avec des sequences de nucleotides de la region 
de HIV-1. 

+ r 

3 Q 0n autre retrovirus denomme SIV-1 , cette 

denomination remplagant la denomination anterieurement 
connue STLV III, a 6 te i$oie chez le singe macaque 
rhesus. (M.D. Daniel et al. Science 228, 1201 (1985) 
N.L.Letwin et al, Science 230, 71 (1985) sous l'appel- 
lation "STLV-IIIraac' 1 ). 
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Un autre retrovirus, designe " STLV-III AGM " , 
(ou SIV. _ M ) a ete isole chez des singes verts sauvages . 

AGM 

Mais, contrairement au virus present chez le singe 
macaque rhesus, la presence de M STLV-III AGM " ne semble 
pas induire une maladie du type SIDA chez le singe vert 
d' Afrique. 

Une souche du retrovirus SIV-lmac a ete 

deposee a la CNCM le 7 Fevrier 1986 sous le n* 1-521. 
Des etudes ont montre que le retrovirus SIV-1 comporte 
certaines prot^ines possedant une certaine parente 
immunologique avec des proteines ou glycoproteines 
structurales susceptibles d'etre obtenues dans des con- 
ditions analogues, a partir de HIV-2. Ce retrovirus 
SIV-1, dont on a constate le caractere infectieux chez 

. 4 u 

les singes, avait ete designe par STLVIII par les cher- 
cheurs qui 1'ont isole (references bibliographiques 

precitees). 

Pour la commodite du langage, ces virus ne 

■ * . 

seront plus designes dans ce qui suit que par 1 f ex- 

■ ( 

pression SIV ( 1 ' expression SIV est 1 'abreviation 
anglaise de "Simian Immunodeficiency Virus 1 ' (virus 
d ' immunodef icience du singe)) eventuellement suivi d'une 

4 » 

abreviation designant l'espece de singe dont ils sont 
issus, par exemple, MAC (ou mac) pour le macaque ou AGM 
pour le singe vert d' Afrique (abreviation de "African 
Green Monkey" ) . 

En mettant en oeuvre les memes techniques que 
celles rappelees plus haut,-il a ete constat^ que l'on 
pouvait egalement obtenir a partir de SIV-lmac : 

une proteine principale du noyau p27, ayant un poids 
moleculaire de l'ordre de 27 kilodaltons, 

- une glycoproteine majeure d'enveloppe, gp140, 

une proteine vraisemblablement transmembranaire p32 f 

* 

qui n'est guere observee en RIPA lorsque le virus a au 
prealable ete marque par la S-cysteine, mais qui peut 
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etre observee dans les essais d ' immunoempreintes 
(Western blots), sous forme de bandes larges. 

. Des etudes plus precises ont ete realisees en 
ce qui concerne les precedents virus HIV-2 et SIV. La 
^ poursuite de 1' etude des retrovirus HIV-2 a egalement 
conduit a I'obtention de sequences d'ADN complementaires 
(ADNc) des ARNs de leurs genomes. La sequence nucleoti- 
dique complete de l r ADNc d'un retrovirus representatif 
de la classe HIV-2 (HIV-2 ROD) a ete deposee le 21/02/- 
^ 1986 a la CNCM sous le n* 1-522, sous le nom de refe- 

: rence LAV- I I ROD) . 

Cette sequence nucleotidique et les phases de 
lecture ouverte quVelle contient sont indiques a la fi- 
gure 1 A. 

_ En outre, la poursuite de 1’ etude d'autres re- 

trovirus a. egalement permis d'aboutir a I'obtention de 
leurs sequences nucleotidiques completes. II en est en 
particulier ainsi de 1 1 ADNc derive de 1 ' ARN genomique de 
SIV. 




30 


Le . clonage et. le sequengage du virus SIV-lmac 
qui ont permis I'obtention de sa sequence nucleotidique 
ont ete realises dans les conditions suivantes : 

L’ADN de cellules HUT 78 infectees par le vi- 
rus SIV (isolat STLV-III mac 142-83 decrit par Daniel et 
al. (1985) Science, 221, p.1201-1204, digtrt partielle- 
ment par 1 1 enzyme de restriction Sau3A a ete clone au 
site BamHI du bacteriophage vecteur Lambda ELBL3 pour 
constituer . une banque genomique. Les 2 millions de pha- 
ges recombinants de la banque genomique ainsi constitute 
ont tte cribles i& situ en conditions de securite P3, a 
l'aide de sequences du virus HIV2 provenant des clones 
lambda-ROD4, lambda-ROD35 et E2 (Clavel et al. (1986- 
Nature, 324 , p.691.) et nick-translatees . 

L'hybridation a ete realisee en 5xSSC a 50*C 


et les lavages en 2xSSC a 50' C. Un seul clone contenant 
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1' ensemble des sequences virales a ete obtenu. Ce clone 
est designe par lambda-SIV-1 . L'inserat du phage lambda- 
SIV-1 mesure 16,5 kb au total et comprend un provirus 
integre auquel manquent seulement les 250 premieres ba- 
ses du LTR gauche, alors que le LTR droit est complet. 

Le provirus integre a ete sequence par la me- 
thode des dideoxynucleotides apres sous-clonage de frag- 
ments aleatoires dans le phage M13mp8. 300 sous-clones 
ont dte analyses. 

Des fragments d ' ADNc provenant du clone Lambda 
SIV-1 inseres dans des plasmides pSIV-1.1 et pSIV-1.2 
ont ete deposes a la CNCM le 15 Avril 1987, sous les 
numeros 1-658 (pSIV-1.1) et 1-659 (pSIV-1.2). 

Les resultats ont ete mentionnes dans les fi- 


. - gures decrites cx-apres. 

1 o 

La figure IB represente la sequence nucleo- 

tidique du, genome viral de SIV et les sequences qui en 

* 

* 

sont deduites pour les proteines virales correspondant 
aux produits des genes gag, pol, env, Q, X, R, tat, art, 






F. 

Les figures 3 a 11 et la figure 1C repre- 
sentent les comparaisons des produits theoriques des 
genes viraux et des LTR entre HIV2 et SIVmac. (ASIV-1). 

L* invention concerne de plus les fragments 
d'ADNc deduits de l 1 ADNc issu du genome entier de SIV-1, 
ces fragments contenant une ou plusieurs sequences is- 
sues de la sequence complete d'ADNc et qui codent pour 
des peptides inter essants de 1' invention. Ces sequences 
sont indiquees a la figure IB et, a la figure 1C pour ce 
qui a trait a la sequence LTR du virus, 

Les sequences- nucleiques de I'ADNc de SIV ont 
ete placees en correspondence avec les sequences nu- 
cleiques du virus HIV-2 ROD pour ce qui concerne la se- 
quence LTR (figure 1C). Cette presentation que l'on re- 
trouve pour le genome entier en rapprochant la figure IB 
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8 

des figures 3 a 11 permet de reperer ou de deduire les 
acides nucleiques ayant des elements de structure essen- 
tials communs aux deux virus . 

L* invention concerne nature llement aussi l r u- 

tilisation des cADNs issus de SIV ou de leurs fragments 


de recombinants les contenant) en tant que sondes, 
le diagnostic de la presence ou non de virus HIV-2 
des echantillons de serums ou d'autres liquides ou 
tissus biologiques obtenus a partir de patients 
suspectes d’&txe porteurs du virus HIV-2. Ces sondes 


(ou 

pour 

dans 


sent 


de 



dgalement (marqueurs 

9 

enzymatiques , f luorescents., etc.). Des 
sondes particulierement interessantes pour la mise en 
oeuvre du procede de diagnostic du virus HIV-2 ou d’un 
variant de HIV-2 peuvent etre 


/ • _ > 


qu'elles comprennent la totalite ou une fraction de 

' * ' 1 * * . ^ * 

l’ADNc complementaire du genome du virus SIV ou encore 


notamment 


les fragments, recombinants contenus dans 


divers clones 


a i 

Les sondes mises en oeuvre dans ce procede de 


diagnostic du virus HIV-2 et dans les 
sont en aucune fagon reduites 


ne 


kits de 
aux 


au contxaire toutes les 
du genome du virus SIV, 
d‘un variant de SIV-ou d’un virus proche par sa structu- 


precedemment . Elies comprennent 

nucldotidiques issues 


30 




fluides biologiques 
developper un SIDA, 
ou d * un virus qui en . 


de 


de 

-2 


La detection peut Stre realisee de toutes 
fagons en soi connues. Elle peut comprendxe une mise en 
contact de ces sondes soit avec les acides nucleiques 
obtenus a partir des cellules contenues dans ces serums 
ou autres milieux biologiques, par exemple liquides 
cephalo-rachidiens r salives, etc... Elle peut aussi 
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comprendre une mise en contact de ces sondes avec ces 
milieux eux-memes des lors que leurs acides nucleiques 
ont ete rendus accessibles a 1 ' hybridation avec ces 
sondes, et ce dans des conditions permettant 1' hybri- 
dation entre ces sondes et ces acides nucleiques. L'e- 
tape finale du diagnostic in vitro comprend alors la 
detection de 1 ' hybridation eventuellement produite. Le 

susdit diagnostic raettant en jeu des reactions d' hy- 
bridation peut egalement etre realise a l'aide de me- 
langes de sondes respectivement originaires d'un HIV-2 
et d'un SIV-1 ou d'un HIV-1, d'un HIV-2 et d'un SIV, des 
lors qu’il n'est pas necessaire de faire une difference 
entre le type de virus recherche. 

D'une fagon generale, le procede de diagnostic 
de la presence ou non du virus HIV-2 ou d'un variant 
dans des echantillons de serums ou d'autres liquides ou 
tissus, . obtenus a partir de patients suspectes d'etre 
porteurs du virus HIV-2 comprend les etapes suivantes ; 

1 / au moins une etape d ' hybridation conduite 
dans des conditions stringentes, par mise en contact de 
l'ADN de cellules de 1 ' echantillon du patient suspect 
avec l'une des susdites sondes marquees sur une membrane 
appropri£e , 

2/ le lavage- de ladite membrane avec une so- 
lution assurant la conservation de ces conditions strin- 
gentes del' hybridation , 

3/ la detection de la presence ou non du virus 

* 

HIV-2 par une methode d 1 immunodetection. 

Dans un autre mode de realisation prefere du 

* 

procede selon 1 ' invention 1 ' hybridation precitee est 
conduite dans des conditions non stringentes et le la- 
vage de la membrane est realise dans des conditions 
adaptees a cel les de 1 ' hybridation. 

II va de soi que 1 ' invention concerne les 
acides nucleiques correspondant a des sequences placees 
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. en des regions analogues de variants de .SIV ainsi que 
tous les acides nucleiques dont les modifications re- 

- V l 

sulteraient de la mise a profit de la degendrescence du 
code genetique. 

^ Les etudes comparatives qui ont aussi permis 

d'aboutir a des resultats relatifs aux proteines de 
noyau (core), ci-apres denommees "proteines gag " et aux 
proteines d ' enveloppes , ci-apres denommees " proteines 
env" , ont egalement ete rapportes dans la demande de 
■jq brevet europeen n* 87/400.151.4, deja citee. Ces re- 
sultats montrent que les proteines du noyau (proteines 
gag ) dans HIV-2 presentent des differences moins ac- 
centuees par rapport a celles des virus HIV-1 , que les 
proteines d'enveloppe (proteines env ) . Globalement les 
15 proteines env . dans HIV-2 se sont revelees presenter des 
; parentes Immunologiques extremement faibles, sinon 

i i ( r 

inexistentes , avec*les proteines env correspondantes des 
virus HIV-1. 

* m 

Au . contraire des etudes comparatives ef fee-. 

tuees entre les structures des sequences d'ADNc des vi- 

t * 

rus HIV-2 et SIV permettent de mettre en evidence cer- 
taines caracteristiques communes qui apparaissent au 

m 

niveau des proteines / 

Globalement, les proteines de HIV-2 et de 
S IV- 1 montrent des parentes immunologiques importantes. 

La glycoproteine majeure d'enveloppe de HIV-2 
s'est revelee etre plus proche immunologiquement de la 
glycoproteine majeure d'enveloppe de SIV que de la gly- 
coproteine majeure d'enveloppe de HIV-1. 

Ces constatations s'imposent non seulement au 
niveau des poids moleculaires : 130-140 kilodaltons pour 
les glycoproteines majeures de HIV-2 et de SIV contre 
environ 110 pour la glycoproteine majeure d 1 enveloppe. de 
HIV-1 , mais aussi au niveau des proprietes immunologi- 
ques, puisque des serums preleves d partir de malades 
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infectes par HIV-2, et plus particulierement des anti- 
corps formes contre la gp140 de HIV-2 reconnaissent la 
gp140 de SIV-lmac, alors que dans des essais semblables 
les memes serums et les memes anticorps de HIV-2 ne 
reconnaissent pas la gpllO de HIV-1. Mais les serums 

anti-HIV- 1 qui n'ont jamais x6agi avec la gp140 de HIV-2 

35 

precipitent une proteine de 26 Kdal marquee par la S- 
cysteine, contenue dans les extraits de HIV-2. 

La proteine majeure du noyau (core) de HIV-2 
semble presenter un poids moleculaire moyen (environ 
26.000) intermediate entre celui de la p25 de HIV-1 et 
la p27 de SIV. 

Ces observations resultent des essais realises 


avec des extraits viraux obtenus a partir du HIV-2 isole 
a partir* de l'un des patients . susmentionnes . Des re- 
sultats similaires ont ete obtenus avec des extraits vi- 






raux du HIV-2 isole a partir du second patient. 

Des etudes plus poussees ont conduit les in- 
venteurs a reconnaitre une premiere classe de peptides 
ayant des sequences d ? aminoacides soit identiques, soit 
proches de sequences contenues a 1 ' interieur des stru- 
ctures des proteines gag et env de HIV-2 ou de SIV voire 
de HIV-1. Ces peptides sont notamment applicables au 
diagnostic d|une infection chez l'homme par le virus 
HIV-2 ou de l'un de ses variants. 

A cet 6gard la presente invention concerne 
ega lenient des procedes et des compositions de diagnostic 
pour la detection in vitro d* anticorps diriges contre un 
virus HIV-2 ou de ses variants, plus particulierement 
dans des echantillons biologiques, notamment des serums 
de patients ayant subi une infection par le virus HIV-2, 
certains de ces peptides permettant une discrimination 
particulierement poussee entre les infections dues a des 
virus HIV- 2 et a des virus HIV-1. 

Ces etudes poussees ont egalement conduit a la 


* ♦ 



WO 88/05440 PCT/FR88/00025 


12 

possibility de synthetiser des peptides immunogenes ou 
susceptibles d’etre rendus immunogenes, presentant des 
caracteris.tiques de structures leur permettant d'induire 

in vivo la production d'anticorps susceptibles de re- 

* 

_ connaitre .des proteines env a la fois dans HIV-1 et dans 

HIV-2 et, au moins pour certains de ces peptides, de se 

■ * * 

fixer tant sur des virus HIV-1 que sur des virus HIV-2, 
plus particulierement aux fins de les neutraliser, 
b 'utilisation de ces derniers types de peptides est done 
10 P aj cticulierement indiquee pour la production de princi- 
pes actifs de vaccins centre les virus HIV, done centre 
le SIDA. 


15 . 



25 


Pour designer ci-apres les residus d'amino- 
acides entrant dans la constitution des peptides selon 
l r invention, on aura recours , pour ceux des acides ami- 

1 r , ‘ ■ 

* * " * i , 

nes ayant une signification univoque a la nomenclature- 
international e designant chaque acide amine naturel par 

, fr -b * * n j 

une lettre unique (lettre majuscule) selon le tableau 

b 

des correspondences qui suit : 

♦ * 

M Methionine 

L Leucine 

I Isoleucine 

V Valine 

F Phenylalanine 

S Serine 

* ■ 

P Proline 

T Threonine . ‘ 



Alanine 

Tyrosine 

Histidine 

Glutamine 


N Asparagine 

K Lysine 

D Acide Aspartique 

E Acide glutaminique 


35 
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5 





C Cysteine 

W Tryptophane 

R Arginine 

G Glycine 

Lorsqu'un acide amine pourra, en raison de sa 
position au sein de la chaine d ’ aminoacides caracte- 
ristique d'un peptide determine, prendre plusieurs si- 
gnif ications , il pourra soit etre designe par un tiret 
si sa signification peut etre quelconque, soit par 
une lettre minuscule lorsque cet aminoacide pourra 
presenter un nombre limit© de significations preferees, 
ce nombre etant cependant tou jours superieur a 1 . Dans 
ce dernier cas, les significations possibles de cette 
lettre minuscule seront toujours precisees en rapport 
avec le peptide auquel il' appartient . 

Afin de faciliter la lecture, ces peptides 

> 

* 

seront designes par une abreviation env ou gag suivie 
d’un indice numerique, par reference a des sequences 
d‘ aminoacides contenues, selon le cas, soit dans les 
proteines env soit dans les proteines gag de pertains 
HIV-1, HIV-2 ou SIV. Il y sera encore fait reference 
dans ce qui suit. 

Enfin dans les definitions qui suivent 




- les groupes X representent soit un groupe NH^ libre ou 
amide, notamment par un ou deux groupes alcoyle com- 
prenant de 1 a 5 a tomes de carbone, soit un groupe pep- 
tidique comprenant de 1 A 5 aminoacides, dont 1* amino- 
acide N-terminal presente lui-meme un groupe NH^ libre 
ou amidA comme precedemment indique, et 

les groupes Z representent, soit un groupe -OH libre 
ou alcoxyle et contenant alors un groupe alcoyle com- 
prenant de 1 a 5 atomes de carbone, soit un groupe pep- 
tidique comprenant de 1 a 5 aminoacides, dont 1’ ami- 
noacide C- terminal presente lui-meme un groupe -OH 
libre . ou alcoxyle, comme precedemment indique, les 


35 
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groupes de 1 a 5 acides amines le cas echeant contenus 
dans .X ou Z ou dans les deux A la fois etant tels, que 

leur presence n'est pas incompatible avec la preserva- 

* 

tion pour l'essentiel des proprietes immunologiques , le 
echeant immunogenes , des peptides qui en sont de- 


pourvus . 


Les peptides selon 1' invention, qui oiit en 
commun des proprietes immunologiques avec des antigenes 
de HIV-2 et, pour certains d'entre eux egalement avec 
des antigenes de HIV-1 ou de ses variants, sont caracte- 


rises en ce qu'ils ont egaement une structure peptidique 
en commun avec les, anti genes, de SIV. De fagon avanta- 

ces peptides comprennent normal ement au plus 40 


geuse, 
residus d' 


amines . 


Des' peptides preferes sont les suivants : 


envl 


XRV- AIEK YL - D QA - LN-WGCAFRQVC Z 
env2 

X- LE - AQ I - Q QEKNMYELQKLN Z 
env_3_ 


XELGD YKL VE I TP I G -APT — KR — 

• i 

env4 


Z 


X VTV- YGVP -WK-AT- - LE CA- Z 

env5 

X- — QE--L-NVTE-F— W-NZ •_ 
env6 

XL S -KP CVKLTPLCV- - Z 

env7 

X— N -S - IT — C-K— — Z 
env8 

X-I— YC-P-G-A-L-C-N-TZ 
env9 

X A-C — W— Z 


envIO 

X-G-DPE— 


— NC-GEF-YCN NZ 
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envl 1 

x C-IKQ-I G— YZ 

Plus particulierement 1 1 invention concerne les 

peptides suivants : 

* 

5 S2Z± 

XRV-AIEKYL-DQA-LN-WGCAFRQVCZ 

env2 

X-LE-AQIQQEKNMYELQXLNZ 

env3 

1Q XELGDYKLVEITPIG-APT--KR Z 

env4 

x VTV-YGVP-W— AT--LFCA-Z 

env5 

X E--L-NVTE-F--W-NZ 

* 

is. savl 

XIi S-KPCVKL-PLC— Z 

env7 

X N-S-I C-K Z 

env8 

20 X-I-— YC-P-G-A-L-C-N-TZ 

env9 

X A-C W— Z 

envIO 

X-G-DPE NC-GEF-YC NZ 

25 ^£11 

X C-I-Q-I G YZ 

Des peptides avantageux correspondent aux pre- 
cedents, presentent les formulas qui suivent : 
envl 

3Q XRVTAIEXYLQDQARLNSWGCAFRQVCZ , ou 
XRVTAI EKYLKDQAQLNAWGCAFRQVCZ 
env2 

XSLEQAQIQQEKNMYEXiQKLNSWZ , OU 
XLLEEAQIQQEKNMYELQKLNSWZ 

35 
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envl 

XELGDYKLVEITPIGFAPTKEKRYSSAHZ , ou 

XELGDYKLVEITPIGLAPTNVKRYTTG-Z 

(On remarquera que les peptides envl , env2 , env3 

attestent de la tres grande parente entre HIV-2 et 
5 

SIV-t. En effet le premier peptide est inclu dans le 
genome de HIV-2 et le second, dans celui de SIV-1 ) . 
env4 

XabcdVTVeYGVPfWogAThiLFCA jZ , 

dans lesquels les lettres de a a j peuvent avoir les 

10 

significations suivantes : 

% 

a est C, E ou D . 

« ■ 

b est T, K, D, N ou I 
c est Q ou It 
g d est Y ou W 

e est F ou Y 

f est T, V ou A , 

g es fc t. N ou E 

h est I ou T 

„ i est P ou T 

20 

j est T ou S 

o est K ou R 


env5 

XabcoEdeLf NVTEgFhiW jNZ , 



a a j peuvent avoir les 


a, est D ou P 
b est D ou N 
c est Y ou P 
d est I, V, I ou L 
e est T, V, E ou A 
f est V, G ou E ou - 
g est A, N, G ou S 
h est D ou N 
i est A ou M 


35 
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j est N, K ou E 
o est Q ou S 
env6 

XLabcSdKPCVKLoPLCuefKZ , 

dans lequel les lettres de a a f peuvent avoir les 
5 

significations suivantes : 
a est F ou W 
b est E ou D 
c est T ou Q 
d est I ou I# 
e est A, S ou T . 
f est M ou L 

0 est T ou S 

u est V ou I 

env7 
15 

XabCNxSylocdCeKf ghiZ , 

dans lequel les lettres de a k i et x et y peuvent avoir 
les significations suivantes : 

4 W * T 

a est N ou T ou X 
b est H ou S ou N 

20 

c est E ou Q 
d est S, A ou C 

e est D ou P — 

f est H, V ou D 

„ g est Y ou S 
25 

h est W ou F 

1 est D ou E 

* . 

x est T ou R 

y est V ou A 

o est T ou Q 
30 

envS 

XalbcdYCxPeGf AgLhCiN jTZ f 

dans leguel les lettres de a A k et x peuvent avoir les 
significations suivantes : 


35 
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a est A ou P. 

b est R ou P 

c est F, I ou C 

d est R. ou H 

e est P ou A 
5 

f est Y ou. F , 
g est L ou I 

h est R ou K 

i est - ou N 

j est D ou K 

10 

x est A ou T 
env9 

XwabcxyAdCef ghizW jkZ r 

dans lequel les lettres de a a 3c et 

les significations suivantes : 

15 

a est K ou - ou 

b est R ou - 

c est P ou M ou 

d est W ou K ou 

e est W ou N ou 

20 

f est F. ou I 

g est K ou S ou 

h est G ou R ou 

i est -* ou A ou 

j est K ou N ou 

25 

3c est D ou A ou 

w est N, D ou I 

x est R ou G ou 

y est Q ou K ou 

„ z est K ou E ou 
30 

envIO 

XaGbDPEcdef ghNCiGEF j YCokxlmnNZ f 
dans lequel les lettres de a a n et 
significations suivantes : 


E 

I 

Y 

T OU R 

N ou G 

E 

T 

D ou S 
N ou K ou E 

K 

R 

Q OU N 


PCT/FR88/00025 


a z peuvent avoir 


peuvent avoir les 
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30 


35 


a est K ou - ou G 

b est S ou G ou - 

c est V ou I 

d est A ou V ou T 

e est Y ou T ou M ou F 

f est M ou H 

g est W ou S 

h est T ou F 

i est R ou G 

j est L ou F 

0 est N ou K 

k est M ou S 

1 est W ou Q ou K ou G 

m est F ou L 

n est L ou F ■ 

x est T ou S ou N 

envl 1 

XabcdwCeloQf IxgyhizG jklYZ , 

* 

dans lequel les. lettres de a a 1 et w a z peuvent avoir 

m 

les significations suivantes : 
a est R ou T ou S ou N 

b est N ou I 

c est Y ou T _ 

d est A ou I* ou V 

e-est H ou R 
f est I ou F 
g est T ou M ' 
h est H ou Q oil A 
i est K ou E 
j est R ou K 
k est N ou A 
1 est V ou M 
w est P ou Q 
x est N ou K 
y est W ou V 
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z est V ou T ou K 
o est K ou R 

La structure du peptide antigenique code par 
le gene gag et designe par aag l est egalement represent 
g tee ci-apres : 

XDCKLVLKGLGaNPTLEEMLTAZ , 

dans lequel la lettre a designe M ou T. 

* 

II sera remarque que, d'une fagon generale, 
les aminoacides ayant une signification univoque (done 
representes par une lettre majuscule correspondent a la 
nomenclature Internationale) qui interviennent dans les 
definitions qui precedent des peptides selon 1* inven- 
tion, se trouvent etre la correspondence avec des amino- 
acides identiques places dans le meme ordre dans les se- 

. quences env ou aaq correspondantes de la proteine env ou 
15 

gag d 1 au moins l'un des HIV, ou de SIV-1. 

Les positions de ces sequences sont soulignees 

-f 

et . reperees au sein des sequences d 1 aminoacides des 

* 

proteines env respectivement de HIV-2 ROD' (CNCM n* 
2Q 1-532) et. HIV-1 BRtJ (CNCM n* 1-232) representdes a la 
figure 2. Par ailleurs, les alignements des acides ami- 
nes des proteines env et gag respectivement de SlV-lmac 
(CNCM n* 1.521) et de HIV-2 ROD sont prdsentdes a la 
figure 3 et a la figure 4. 


25 




30 


de ces sequences visent d souligner 
que certains aminoacides contenus dans ces sequences ont 
ete volontairement deletes au plan de la presentation, 
afin de permettre la mise en alignement d ‘ aminoacides 
respectivement identiques (alors marques d'un aste- 
risque) ou de deux points verticaux sur une meme ligne 


dantes de HIV-1 et de HIV-2 d'une part, de SIV et de 
HIV-2 d 1 autre part. 
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Outre les peptides precites, 1 ' invention con- 
cerne egalement les peptides modifies par insertion 
et/ou deletion et/ou substitution d'un ou plusieurs 
acides amines, pour autant que les proprietes antige- 
- niques ou immunogenes desdits peptides ne sont pas mo- 

3 

difi£es, ou que les proprietes de reconnaissance de 

1' antigene ou de l 1 anticorps avec lesdits peptides ne 

sont pas substantiellement modifiees. 

Dans un mode de realisation particulierement 

prefere, 1* invention concerne des peptides ayant des 

proprietes immune logiques en commun avec 1 1 ossature 

peptidique de la glycoproteine d*enveloppe des virus de 

la classe HIV-2, ces peptides contenant un nombre de 

■ 

residus d’ acides amines n’exc^dant pas 40. 

, f < 

^ Ces peptides preferes selon 1* invention ont 

les sequences suivantes : 

I . * *v «■ * * fc 

envl 

RVTAIEKYLQDQARLNSWGCAFRQVC ’ 

AIEKYLQDQ 

2Q RVSAIEKYLKDQAQIiNAWGCAFRQVC 

AIEKYLKDQ 

env2 

SLEQ AQ I QQEKNMYELQKLN SW 
QIQQEKN 

2 5 LLEEAQ I QQEKNMYELQKLNSW 
env3 

ELGDYKLVEITPIGFAPTKEKRYSSAH 
YKLVEITP IGFAPTKEK 
ELGDYKLVEITPIGLAPTNVKRYTTG- 
3Q YKLVEITPIGLAPTNVK 

env4 

CTQYVTVFYGVPTWKNATIPLFCAT 

VTVFYGVPTWKNAT 

* 

C I Q Y VT VF YGVPAWRNAT IPLFCAT 


35 


VTVFYGVPAWRNAT 
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EKLWVTVYYGVPVWKEATTTLFCAS 

VTVYYGVPVWKEAT 

EDLWVTVYYGVPVWKEATTTLFCAS • 

# ► 

VTVYYGVPVWKEAT 

DNLWVTVYYGVPVWKEATTTLFCAS 

VTVYYGVPVWKEAT 

env5 

DDYQE I TL-NVTEAFD AWNN 

L-NVTEAF 

DDYSELAL-NVTESFDAWEN 

10 

L-NVTESF 

PNPQEWIiVNVTENFNMWKN 

LVNVTENF 

PNPQEIELENVTEGFNMWKN 

LENVTEGF 

15. 

PNPQEIALENVTENFNMWKN 

LENVTENF 

env6 

ETS IKPCVKLTPLCVAMK 
ETSIKPCVKLSPLCITMR 

20 

DQSLKPCVKLTPLCVSLK 
DQSLKPCVKLTPLCVTLN . 
PCVKLTPLCV 

env7 

„ NHCNTSVITESCD 
25 

NTSVIT 

NHCNTSVIQECCD 

NTSVIQ 

TSCNTSVITQACP 

^ NTSVIT 
30 

INCNTSVITQACP 

NTSVIT 

INCNTSAITQAGP 

NTSAIT 
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env8 

YCAPPGYALLRC-NDT 

YCAPAGFAILKCNNKT. 

YCAPAGFAILKCNDKK 

YCAPAGFAILKCRDKK 

eflvl 

NKRPRQAWCW FKG-KWKD 
NERPKQAWCRFGG-NWKE 
N- -MRQAHCNI SRAKWNA 
D— IRRAYCTINETEWDK 
I — I GQ AH CN I S RAQ W SK 
envIO 

KG SDPEVA YMWTNCRGEFLY CNMTWFLN 

NCRGEFLYCN 

GG - DPEVTFMWTNCRGEFLYCKMNWFLN 

NCRGEFLYCK 

-GGDPEIVTHSFNCGGEFFYCNSTQLFN 

NCGGEFFYCN 

-GGDPEITTHSFNCRGEFFYCNTSKLFN 

NCRGEFFYCN 

-GGDPEITTHSFNCGGEFFYCNTSGLFN 

NCGGEFFYCN 


envl 1 





RNYAPCHIKQ I INTWHKVGRNVY 
CHXKQII 

RN YVP CHI RQ I INTWHKV GKNV Y 
CHIRQII 

T I TLP CR IKQFINMWQEVGKAMY 
CRIKQFI 

SITLPCRIKQIINMWQKTCKAMY 

CRIKQII 

NITLQCRIKQIIKMVAGR-KAIY 

CRXKQII 

qaql 

D CKLVLKGL GTNPTLEEMLTA 
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Les peptides selon 1 ' invention peuvent encore 
avantageusement etre prepares par les techniques clas- 
siques, dans le domaine de la synthese des peptides. 

Cette synthese peut etre realisee en solution homogene 

2 ou en phase solide. * 

Par exemple, on aura recours a la technique de 

synthdse en solution homogene deer it par HOUBENWEYL dans * 

1 1 ouvrage intitule ,r Methode der Organischen Chemie" 

(Methode de la Chimie Organique) edite par E. Wunsch, 

1Q vol. 15-1 et XI. r THIEME, Stuttgart 1974. 

Cette mdthode de synthdse consiste a condenser 
successivement deux-a-deux les aminoacyles successifs 
dans l'ordre requis, ou a condenser des aminoacyles et 

des fragments prealablement formes et contenant deja 

^ * 

15 plusieurs aminoacyles dans l'ordre approprid, ou encore 
plusieurs fragments prealablement ainsi prepares, etaht 
entendu que 1 ' on aura eu soin de proteger au prealable 
toutes les fonctions reactives portees par ces amino- 
acyles ou fragments', a 1 * exception des fonctions amines 
2 q de l*un et carboxyles de 1’ autre ou vice-versa, qui 
doivent normalement intervenir dans la formation des 
liaisons peptidiques, notamment apres activation de la 
fonction carboxyle, selon les mdthodes bien connues dans 
la synthese des peptides. En variante, on pourra avoir 

„ recours a des reactions de coupiage mettant en jeu des 
25 

reactifs de coupiage classique, du type carbodiimide , 
tels que par exemple la 1 -ethyl-3- (3-dimethyl-amino- 
propyl) -carbodiimide. Lorsque l'aminoacyle mis en oeuvre 
possede une fonction acide supplemental re (notamment 
30 dans le cas de 1' acide glutamique) , ces fonctions seront * 

par exemple protegees, par des groupes t-bus tyl ester . 

Dans le cas de la synthese progressive, acide * 

amine par acide amine, la synthese debute de preference 
par la condensation de 1 ' ami no -acide C-terminal avec 
3 g I'aminoacide qui correspond a l'aminoacyle voisin dans 


* 
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la sequence desiree et ainsi de suite, de proche en 
proche, jusqu'a l'acide amine N-terminal. Selon une 
autre technique preferee de 1’ invention, on a recours a 
celle decrite par R.D. MERRIFIELD dans 1' article 
intitule "Solid phase peptide synthesis" (J. Am. Soc., 
15, 2149-2154). 

Four fabriquer une chaine peptidique selon le 
procede de MERRIFIELD , on a recours a une resine polym£- 
re tres poreuse, sur laquelle on fixe le premier acide 
amine C-terminal de la chaine. Cet acide amine est fixe 
sur la resine par 1 ' intermediaire de son groupe 
carboxylique et sa fonction amine est protegee, par 
exemple par le groupe t-butyloxycarbonyle . 

Lorsque le premier acide amine C-terminal est 






m . *i 

ainsi fixe sur la resine, on enleve le groupe protecteur 

# r 

de la fonction amine en lavant la resine avec un acide. 

4 * 

Dans le cas ou le groupe protecteur de la 
fonction amine est le groupe t-butyloxycarbonyle, il 

m 

peut &tre ^limine par traitement de la resine a 1! aide 

* 

d' acide trif luoroacetique . 

On couple ensuite le deuxieme acide amine qui 
fournit le second amino-acyle de la sequence recherche, 
a partir du residu amino-acyle C-terminal sur la fonc- 
tion amine deprotegee du premier acide amine C-terminal 
£ix4 sur la chaine. De peference, la fonction carboxyle 
de ce deuxieme acide amine est activee, par exemple par 
la dicyclohexylcarbodiiraide, et la fonction amine est 
protegee, par exemple par le t-butyloxycarbonyle. 

On obtient ainsi la premiere partie de la 
chaine peptidique recherchee, qui comporte deux acide 
amines , et dont la fonction amine terminale est 
protegee. Comme preced eminent, on deprotege la fonction 
amine et on peut ensuite proceder a la fixation du 
troisieme aminoacyle, dans les conditions analogues a 
celles de 1' addition du deuxieme acide amine C-terminal. 
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25 


On fixe ainsi, les uns apres les autres, les 
acides amines qui vont constituer la chaine peptidique 
sur le groupe amine chaque fois deprotege au prealable 
de la portion de la chaine peptidique dej£ formee, et 
qui est rattachee a la resine. 

Lorsque la totalite de la chaine peptidique 

desiree est * formee, on elimine les groupes protecteurs 

* 

des diffexents acide amines constituent la chaine pepti- 
dique et on detache le peptide de la resine par exemple 
a I'aide d 1 acide fluorydrique . 

I* 1 invention concerne egalement les oligomexes 
hydro solubles des peptides monomer es sus-indiques . 
L ' oligomerisation peut provoquer un accroissement de 
1 ' immunogenicite des peptides monomeres selon 1 * inven- 
tion. Sans qu'une telle indication chiffree puise etre 
consider ee comme limitative, on mentionnera neanmoins 

, 4 

,que ces oligomer^s peuvent, par. exemple, contenir de 2 a 
10 unites monomeres. 

Les unites monomeres entrant dans cet oli'go- 
mere sont soit toutes constitutes par le polypeptide de 
sequence 1 ou par le polypeptide de sequence 2, soit par 
1 ' un et 1 ' autre de ces polypeptides . 

On peut avoir recours , pour realiser 1 1 oligo- 
merisation, a toute technique de polymerisation couram- 
ment utilisee dans le domaine des peptides, cette poly- 
merisation etant conduite jusqu ' a 1 1 obtention d 1 un oli- 
gomere ou polymer e coxitenant le nombre de motifs mono- 
meres requis pour 1* acquisition de 1 1 immunogenicite 



Une methode d' oligomerisation ou de polyme- 
risation du monomere consiste dans la reaction de 
celui-ci avec un agent de reticulation tel que le glu- 
taraldehyde . 

On peut ' egalement avoir recours a d' autres me- 
thodes d 1 oligomerisation ou de couplage, par exemple a 
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5 






celle mettant en jeu des couplages successifs d' unites 
monomeres, par 1 ' intermediaire de leurs fonctions ter- 
minales carboxyle et amine en presence d' agents de cou- 
plage homo- ou hetero- bifonctionnels . 

On peut egalement pour la production de mole- 
cules comportant un ou plusieurs motifs de 17 acides 
amines tels que definis ci-dessus r avoir recours a des 
techniques du gdnie genetique mettant en oeuvre des 
micro-organismes transformes par un acide nucleique 
determine comprenant des sequences nucleotidiques ap- 
propriees correspondantes. 

V invention concexne egalement les acides nu- 
cleiques contenant une ou plusieurs sequences issues de 
la sequence de l’ADNc du virus HIV-2 ROD. Ces sequences 
ireperees par la numerotation figurant sur la sequence 
precedemment * decrite, codent pour certains peptides 
interessants de 1 ’ invention . 


Sequence 

codant 

pour envl 

nucleotides 

* 

7S50 

* 

a 

7927 

It 

ll 

env 2 

n 

8030 

. a 

8095 

« 

» 

env3 

ll 

7601 

a 

7636 

11 

it 

env4 

it 

6170 

a 

6247 

It 

it 

env5 

ft 

6294 

% 

a 

6349 

J» 

ll 

env 6 

ii 

6392 

% 

a 

6445 

II 

It 

env7 

• 

tt 

6724 

a 

6763 

it 

ii 

env 8 

it 

* 

6794 

A 

6838 

II 

It 

env9 

n 

7112 

A 

7162 

tt 

ti 

envIO 

tt 

7253 

A* 

7336* 

II 

ti 

envl 1 

tt 

7358 

A 

7426 

II 

ll 

aaal 

it 

1535 

£1 

1597 


2 q L* invention concerne enfin les acides nu- 

cleiques correspondants du virus SIV, contenant une ou 
plusieurs sequences issues de l’ADNc du virus SIV-1. Ces 
sequences codant pour les peptides envl A envl 1 et gad 
peuvent etre reperes sur la figure 3 par comparaison 
25 avec les sequences correspondantes decrites pour HIV-2. 
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II va de s.oi que 1* invention concerne les 
acides nucldiques correspondent a des sequences placees 
en des regions analogues des ADNc derives de variants de 
HIV-2 ROD ou de SIV, ainsi que tous les acides nuclei- 
ques dont les modifications vis a vis des precedents 
resulteraient de la mise a profit de la degenerescence 
du code g^netique. 

V invention concerne encore les conjugues 
obtenus par couplage covalent des peptides selon 1 ' in- 
yention (ou des susdits oligomer es) a des molecules por- 
teuses (nature lies ou synthetiques) , physiol ogiquement 
acceptables et non toxigues, par 1 1 intermediate de 
gxoupements reactifs complementaires respectivement por- 
tes par la molecule porteuse et le peptide. Des exemples 
de groupements appropries sont illustres dans ce qui 


suit : 


A titre d’exemple de molecules porteuses ou 


supports macromoleculaires entrant dans la constitution 

» * 

des conjugues selon 1* invention, on mentionnera .des 
proteines naturelles, telles que l'anatoxine t£tanique, 
1' ovalbulmine, des serums albumines, des hemo cy amine s , 


* ■ 


A titre de support macromoleculaires syntheti- 
r on mentionnera par exemple des polylysines ou des 
poly ( D-L-alanine ) -poly (D-ly sine ) . 

Da litterature mentionne d'autres types de 


d ' itre utilises , 
un poids moleculaire 


supports macromoleculaires 
lesquels presentent en general 
superieur a 20 000. 

Pour synthetiser les conjugues 
1 1 invention, on peut avoir recours a des precedes connus 
en soi, tels que celui decrit par FRANTZ et ROBERTSON 
dans Infect.* and Immunity, ^3, 193-198 (1981), ou celui 
decrit dans Applied and Environmental Microbiology, 
(octobre 1981), vol. 42, n* 4, 611-614 par P.E. KAUFFMAN 


35 



WO 88/05440 


PCT/FR88/00025 


29 

en utilisant le peptide et la molecule porteuse appro- 

* 

priee . 

Dans la pratique, on utilisera avanta- 
geusement comme agent de couplage les composes suivants, 
5 cites a titre non limitatif : aldehyde glutarique, 

chlorof ormiate d 1 ethyle f carbodiiraides hydrosolubles 

* 

[N-ethyl-N ' ( 3-dimethylamino-propyl ) carbodiimide , HC1] , 
diisocyanates , bis-diazobenzidine, di- et trichloro-s- 
triazines, bromures de cyanogene, ainsi que les agents 
jQ de couplage mentionnes dans Scand. J. Immunol., (1978), 
vol. 8, p. 7*23 (AVRAMEAS, TERNYNCK , GUESDON) . . 

On peut avoir recours a tout precede de 
couplage faisant intervenir d'une part une ou plusieurs 
fonctions reactives du peptide et d' autre part, une ou 

* * t , , * t 

^ plusieurs fonctions reactives de molecules supports. 

Avantageusement , il s'agit des fonctions carboxyle et 

* 

b 

amine, lesquelles peuvent donner lieu a une reaction de 
couplage en presence d'un agent de couplage du genre de 

4 

ceux utilises dans la synthese des proteines, par 
2 0 exemple, le 1 -ethyl-3- (3-dimethylaminopropyl)- 

carbodiimide, le N-hydroxybenzotriazole, etc... On peut 
encore avoir recours 4 la glutaraldehyde, notamment 
lorsqu'il s'agit de relier entre eux des groupes amines 
respectivement portes par le peptide et la molecule 

25 support. 

Les peptides selon 1' invention poss&dent des 
proprietes antigeniques . Ils peuvent done etre utilises 
dans des proced^s de diagnostic pour la detection d'.une 
infection par le virus HIV-2. 

Comme on l'a dej4 mentionne, des etudes ont 
permis de distinguer deux groupes de peptides pouvant 
etre mis en oeuvre dans des precedes de detection d’an- 

t 

ticorps contre le virus HIV-2 dans un fluide biologique 
humain, notamment un sdrum ou un liquide cephala~ra- 
chidien . 


35 



WO 88/05440 


PCT/FR88/00025 


5 






30 

Un premier groupe (I) comprend les peptides 
gaa ^ . Ces peptides reconnaissent des anticorps anti- 
HIV-2 et sont done capables de detecter une infection 
par HIV-2. IXs reconnaissent egalement dans une certaine 
mesure des anticorps anti-HIV- 1. 

Un second groupe (II) comprend des peptides 
qui correspondent plus particulierement a ceux qui sont 
situds dans la par tie transmembranaire et dans la fin de 
la partie externe de la proteine d ' enveloppe . Ces pep- 
tides sont ceux precedemment designes par envl . env2 et 
env3 . II s pexmettent »la reconnaissance specif ique de la 
presence . d ‘ anticorps contre HIV-2 et permettent done de 
discriminer chez une personne les infections passees ou 
presentes dues a un HIV, plus particulierement entre 
celles qui ont ete provoquees par un HIV-2 et celles qui 

1 ' ont ete par un HIV-1. 

* 

L' Invention concerne egalement une composition 

contenant au moins . 1 * un des susdits peptides ou au moins 

^ * * 

un oligomere de ce peptide, caracterisee en ce quelle a 
la capacity d ' etre reconnue par des serums d * origine hu- 
maine contenant des anticorps contre le virus HIV-2. 

L ’ invention concerne un precede de diagnostic 
in vitro un ou des peptides selon 1' invention pour la 
detection d' anticorps contre HIV-2 dans des fluides bio- 
logiques, en particulier dans des serums humains. 

D'une fagon gen^rale le precede de diagnostic 
in vitro ci-dessus comprend les etapes suivantes : 

* V 

- la mise en contact de ce liquide biologique 


30 


la detection de la presence eventuelle d'un 
complexe peptide-anticorps par des methodes physiques ou 
chimiques, dans ledit liquide biologique. 

Dans un mode de realisation pr6f£re de 1* in- 
vention, la detection du complexe antigene-anticorps est 
realisee grice a des tests immunoenzymatiques (du type 
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ELISA), immunof luores cents (du type IFA) , radioimmunolo- 
giques (du type RIA) ou des tests de radio imraunopreci pi - 
tation (du type RIPA) . 

Ainsi 1 ' invention concerne egalement tout peptide selon 
5 1' invention marque & l'aide d'un marqueur adequat du 

type enzymatique, fluorescent, radioactif, etc... 

De telles methodes comprennent par exemple les 
etapes suivantes : 

depot de quantites determinees d'une 
composition peptidique selon l 1 invention dans les puits 
d’une microp.laque de titration, 

- introduction dans lesdits puits de dilutions 
croissantes du serum devant etre diagnostique, 

- incubation de la microplaque, 

Y5 ' - ringages .repet es de la microplaque, 

introduction dans les puits de la micro- 
* plaque d ' anticorps • marques contre des immunoglobulines 
du sang, le marquage de ces anticorps ayant ete realisd 
a l'aide d’une enzyme selectionnee parmi celles qui sont 

20 capables d'hydrolyser un substrat en modifiant 1’ absor- 
ption des radiations de ce dernier, au moins a une lon- 
gueur d'onde determinee, 

detection, en comparaison avec un temoin de 
controle, de la quantite de substrat hydrolyse. 

2 5 L* invention concerne egalement des cof frets ou 

kits pour le diagnostic in vitro de la presence d 1 anti- 
corps contre les virus HIV -2 et, dans certains cas, 

HIV -1 dans un milieu biologique qui comprennent : 

- une composition peptidique selon I'inven- 

* 

30 tion ' 

les reactifs pour la constitution du milieu 
propice & la realisation de la reaction immunologique , 

- les reactifs permettant la detection du com- 
plexe antigenes-anticorps produit par la reaction im- 

35 munologique. De tels reactifs peuvent egalement porter 
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5 




20 




un marqueur, ou etre susceptibles d'etre reconnus a leur 
tour par un reactif marque. Plus particulierement dans 
le cas ou la composition polypeptidique sus-mentionnee 
n'est pas marquee. 

un tissu fluide biologique de reference de- 
pourvu d' anticorps reconnus par la composition polypep- 
tidique sus-mentionnee, 

L' invention concerne les anticorps eux-memes 
formes contre les peptides de 1' invention. 

II va de soi que cette production n'est pas 
limitee aux anticorps polyclonaux. 

Elle s' applique encore a tout anticorps mono- 
clonal produit par tout hybridome susceptible d'etre 
forme, par des methodes classiques, a partir des cel- 
lules spleniques d'un animal, nbtamment de souris ou de 
rat,. immunises contre I'un des peptides de 1' invention, 
d'une part . et des cellules d'une lignee de cellule 

myelome approprie d' autre part, et d'etre selectionne, 

* . * 

par sa capacite . a produire des anticorps monoclonaux 
reconnaissant le peptide initialement mis en oeuvre pour 
1 ' immunisation des animaux. 

I* 1 invention concerne 4galement des composi- 

* 

tions immunogenes pour la production de vaccins dont le 
principe actif est constitue par au mo ins un peptide 
selon 1* invention, ou un oligomexe de ce peptide, ou un 
peptide sous forme conjuguee avec une molecule porteuse, 
caracterisees en ce qu'elles induisent la production 
d'ariticorps contre les susdits peptides en quantite suf- 
fisante pour aussi inhiber les proteines du retrovirus 
HIV-2, voire meme le retrovirus HIV-2 entrant en asso- 
ciation avec un v£hicule pharmaceutiquement acceptable. 

Les compositions immunogenes pour la produc- 

* w 

tion de vaccins comprennent de fagon avantageuse plus 
particulierement au moins I'un des peptides pr4cedemment 
d^signes pax env4 , env5 , env6 , env7 , env8 . env9 . env10 r 
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envl 1 voir des melanges de ceux-ci. 

Parmi ces peptides aptes a constituer des 
principes actifs de vaccins certains sont particulie- 
rement preferes car ils possedent une structure de base 
en acides amines correspondant I des regions des glyco- 
proteines d'enveloppe qui presentent un important degre 
de conservation, non seulement dans les HIV- 2, et dans 
les SIV, mais egalement dans les HIV-1. Ces peptides 
particulierement pr6fer£s sont les peptides designes par 
env4 , certains peptides env5 . env6 et env 1 0 . 

Dans un mode de realisation prefere de 1' in- 
vention les peptides immunogenes (ou fragments de ces 
peptides) aptes a constituer des principes actifs de 
vaccins sont choisis parmi ceux dont les formules cor- 
respondent -a des sequences qui, dans les glycoproteines* 
d'enveloppe de HIV-2, SIV et HIV-1 presentant une 
homologie en acides amines- superieure a 50%, qui appar,- 

tiennent a la partie externe.de 1 1 enveloppe du virus, 

# 

* 

qui sont depourvus ou presque de deletions, et qui ren- 

t 

ferment des residus de cysteine favorables a la stabili- 
sation des liaisons et a la constitution de boucles 


d ' ancrage . 

Les peptides suivants appartiennent a cette 
categorie de peptides preferes. 

25 

XVTV-YGVP -W--AT Z 


env 5 

XL-NVTE-FZ 


env 6 

XKPCVKL-PLC-Z 

env7 

XN-S-I-Z 


env 10 


XNC-GEF-YC-Z 
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15 
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25 


30 


envl 1 
XC-I-Q-IZ 

Des compositions pharmaceutiques avantageuses 
sont constitutes par des solutions, suspensions ou li- 
posomes injectables contenant une dose efficace d'au 

moins un produit selon 1* invention. De preference, ces 

* 

solutions, suspensions ou liposomes sont realises dans 
une phase aqueuse stexilisee isotonique, de preference 
saline ou glucosee. 

L* invention concerns plus particulierement de 
telles suspensions, solutions ou forme liposome qui sont 
aptes a etre administrees par injections intradermiques , 
intramusculaires ou sous-cutanees, ou encore par scari- 
fications . 

Elle concexne egalement des compositions phar- 

f # i ‘ t 

i ' m m m * . + ■ *■ 

maceutiques administrates par d’autres voies, notamment 

1 - * 1 

par voie orale. . t . 

* , 1 , ♦ 

Les compositions pharmaceutiques selon 1’ in- 
vention, utilisahles en tant que vaccins pour etre effi- 

* «. m 

caces dans la production d 1 anticorps contxe le virus 

r f * 

HIV-2, peuvent a titre d'exemple etre administrees a des 
doses situees entre 10 et 500 yg/kg, de peptides selon 
1' invention, de preference de 50 a 100 pg/kg. 

Ces doses sont citees a titre d'exemple et ne 
possedent en aucun cas un caractdre limitatif . 

Comme on l'a deja indique plus haut les dif- 
ftrents peptides qui ont tte definis peuvent comprendre 
des modifications qui n'ont pas pour effet de modifier 
de fagon fondamentale leurs proprittes immunologiques . 
Les peptides equivalents qui en resultent entrant dans 
le champ des revendications qui suivent. A titre d'exem- 
ples de peptides Equivalents on mentionnera ceux dont 
les structures en correspondence avec des regions des 
ADNc d’autres variants de HIV-2 de SIV ou de HIV-1, 

p 

lorsque ces regions ont ete mises en alignement dans des 
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conditions semblables a celles qui ont ete evoquees 

ci-dessus, a propos do HIV-2 ROD, SIV et HIV-1 BRU. A 

titre d'autres de ces peptides, on mentionnera ceux dont 

les structures sont en correspondance avec de telles 

regions dans les ADNc qui ont fait l'objet de depots a 
5 

la CNCM, notamment sous les numeros 1-502, 1-642 [HIV-2 
IRMO), 1-643 (HIV-2 EHO) ainsi que, dans les cas 
appropries, des variants de HIV-1 qui ont fait l'objet 
de depots a la CNCM sous les numeros 1-232, 1-240, 
1Q 1-241, 1-550, 1-551. 

Les peptides selon 1' invention peuvent encore 
etre definis par les formules suivantes (dans lesquels 
X, Z et les tirets " ont les significations sus-indi- 
quees ) : 
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XR V -A I EKYL - DQA-LN - WGCAFRQ VC Z 
XAIEKYL-DZ 

X-LE-AQIQQEKNMYELQKLNSWZ 

XQIQQEKNZ 

XELGDYKLVEITPIG-APT — KR Z 

XYKLVEITPIG-APT — KRZ 

* 

X VTV-YGVP-W--AT--LFCA-Z 

XVTV-YGVP-W — AT Z 
* 

X E--L-NVTE-F--W-NZ 

XL-NVTE-FZ 





A hb | t P >i r | T 

XL S-KPCVKL-PLC Z 

XKPCVKL-PLC-Z 

XS-KPCVKL-PLC-Z 

X N-S-I C-Z 

XN-S-r-Z 

XYC-P-G-A-L-C-N-TZ 
X A-C W— Z 

p 

NKRPRQ AWCWFKG -KWKD 


X-G-DPE NC-GEF-YC S*Z 

30 

X C-I-Q-I — * G YZ 
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* L’ invention concerns egalement outre Xes pep- 
tides de SIV deja decrits, les proteines codees par 
1‘ADNc du virus SIV. Elle concerne egalement les pro- 
teines de tout virus immunologiquement etroitement ap- 
parente a SIV-lmac, en particulier tout virus dont les 
proteines et les glycoproteines d'enveloppe croisent 
immunologiquement et dont les ADNc presentent un pour- 
centage d'homologie d'au moins 95% et de preference d'au 
moins 98%. 







En particulier 1 1 invention concerne : 

1/ les proteines et glycoproteines de I'enveloppe codees 
par le gene env et representees a la figure 3, 

2/ la proteine GAG representee a la figure 4, 

3/ la proteine POL representee a la figure 5, 

4/ la proteine Q representee a la figure 6, 

5/ la proteine R representee a la figure 7, 

6/ la proteine X representee a la figure 8, 

7/ la proteine F representee a la figure 9, 

8/ la proteine TAT representee a la figure 10, 

Les acides amines des proteines precitees de 
SIV, ont ete representees en alignement avec les se- 
quences d* acides amines des proteines correspondantes du 
virus HIV-2 ; les points verticaux figurant entre les 
deux sequences correspondent aux acides amines communs 
entre les proteines des deux ‘virus. 

Les sequences d'ADNc codant pour les proteines 
precitees apparaissent sur la figure IB. L* invention 
concerne, outre les sequences nucleiques precitees toute 
sequence nucleiques modifiee, qui code egalement pour 
les proteines du retrovirus SIV ou d*un variant. 

Ces sequences d‘ADNc reperees par la numerota- 
tion figurant sur les sequences - decrites precedemment 
(figure IB) sont les suivantes : 
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-sequence codant pour GAG , nucleotides 551 a 2068 


10 


it 


ti 


tl 


'I 


II 


U 


tl 


tl 


tl 


It 


tt 


IT 


II 


It 


« 


II 


M 


11 


II 


POL . 

Q, 

X, 

R, 

F, 

TAT-1 
ART-1 
TAT- 2 
ART- 2 
ENV 


It 


tl 


It 


It 


II 


tl 


II 


n 


ft 


U 


1726 a 4893 
4826 a 5467 
5298 a 5633 
5637 a 5939 
8569 a 9354 
5788 a 6084 
6014 a 6130 
8296 a 8391 
8294 a 8548 
6090 a 8732 




15 


L' invention concerne done naturellement les 

, lorsqu'elles sont 
obtenues a partir du virus SXV ou lorsqu'elles sont 
preparees par une raethode de synthese, notamment par 
1'une des methodes deja citees en rapport avec la syn- 


20 



30 


L' invention concerne egalement 1 1 utilisation 
» 

des proteines precedentes pour le diagnostic de la pre- 
sence eventuelle d* anticorps diriges contre les pro- 
teines de HIV-2, voire contre HIV-2 en entier, ou pour 

certaines d'entre ellesl* utilisation aux fins de dia- 

% 

gnostic d'une infection due a l'un des virus HIV. Ainsi 
le peptide GAG code par le gene correspondent peut etre 
utilise pour reperer la presence eventuelle d' anticorps 
anti-HIV- 1 ou anti-HIV-2. Les proteines ENV sont utili- 
sees de preference pour le diagnostic specif iaue d'une 


infection due a HIV-2 ou un de ses variants, parfois 

* » 

pour le diagnostic d'une infection par HIV-2 ou HIV-1. 

L* invention concerne done dgalement un procede 
de diagnostic in vitro de detection d 1 anticorps contre 
HIV-2 et eventuellement contre HIV-1 dans des fluides* 
biologiques et en particulier dans des serums humains . 
De tels precedes applicables pour 1 'utilisation des pro- 


nrprpHpnfos Ho CTU rrvr n-mo i-kT“r*\4“<a 4 woe? Aa H4 *▼«****. 4.4 
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ont deja ete decrits dans la presente invention. 

Ii’ invention concerns aussi des cof frets ou 
"kits" pour le diagnostic in vitro de la presence d' an- 
ticorps le virus HIV-2 et dans certains cas contre HIV-1 
dans un milieu biologique. De tels kits mettant en oeu- 
vre les peptides precedents ont egalement ete decrits 
dans la presente invention. 

I*' invention concerne egalement des composi- 
tions immunogenes pour la production de vaccins, dont le 
principe actif est constitue de fagon avantageuse par au 
moins la partie de la proteine ENV du virus SIV, cette 
proteine pouvant etre sous forme conjugu^e avec une mo- 
lecule porteuse. Ces compositions immunogenes induisent 
la production d* anticorps contre le susdit peptide en 
quantite suffisante pour inhiber les proteines du re- 
trovirus HIV-2, voire le retrovirus HIV-2 lui-meme. 

Toutefois 1' utilisation aux fins de diagnostic 
des proteines de SIV n'est en rien limitee a celle des 
seuls proteines ENV pu GAG . D’autres proteines parmi 


20 


celles decrites peuvent etre envisagees, pour preparer 
des compositions de diagnostic voire de vaccin. 
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REVENDICATIONS 

1 / Peptide ayant des proprietes immunologiques en 

commun avec celles de l 1 ossature peptidique de la glyco- 
proteine d'enveloppe des virus de la classe HIV-2, ca- 
5 racterise en ce qu'il a £galement une structure pepti- 
dique en conunun avec 1 1 ossature peptidique de la glyco- 
proteine de SIV.1. 

2/ Peptide ayant des proprietes immunologiques en 

commun avec celles de 1 ' ossature peptidique de la 
^0 glycoproteine d'enveloppe des virus de la classe HIV-2 , 

. ces peptides contenant un nombre de residus d'acides 
amines n'excedant pas 40, caracterise en ce qu’il a 
egalement une structure peptidique en commun avec 
1' ossature peptidique de la glycoproteine de SIV,1. 
e 3 /. Peptide selon , la revendication 2 caracterise 

par 1 ’une des formulas : 

i ' V ’ ■ r 

XRV-AIEKYL-DQA-LN-WGCAFRQVCZ 

XAIEKYL-DZ 

t , i 

% 

dans laquelle- X et Z. sont des ; groupements OH ou NH^ ou, 
20 dans la mesure ou les proprietes immunologiques du 
peptide depourvu de ces groupes ne s’en trouvent pas es- 
sentiellement modifiees, des groupes comportant de 1 a 5 
residus d'acides amines, et chacun des tirets correspond 
a un residu aminoacyle chois i parmi ceux qui permettent 
25 de conserver au peptide sus-d 6 fini les proprietes immu- 
nologiques de l'une des sequences suivantes : 
RVTAIEKYLQDQARLNSWGCAFRQVC 
AIEKYLQDQ 

RVSAIEKYLKDQAQLNAWGCAFRQVC 
30 AIEKYIiKDQ 

4/ Peptide selon la revendication 2 caracterise 

pax l'une des formules : 

. X -LE - AQ I QQEKNMYEI. QKLN SW Z 
XQIQQEKNZ 

3 5 dans laquelle X*et Z sont des groupements OH ou NH^ ou, 
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dans la mesure ou les proprietes immunologiques du 
peptide depourvu de ces groupes ne s'en trouvent pas es- 
sentiellement modifiees, des groupes comportant de. 1 a 5 
residus d'acides amines, et chacun des tirets correspond 
a un residu aminoacyle choisi parmi ceux qui pexmettent 
de conserver au peptide sus-defini les proprietes immu- 
nologiques de l'une des s4quences suivantes : 
SLEQAQIQQEKNMYELQKI/NSW 
QIQQEKN 

* 

LLEEAQIQQEKNMYELQKIiNSW 

» 

5/ Peptide selon la revendication 2 caracterise 

par l'une des formules : 

XELGDYKIiVEITPIG-APT — KR Z 

XYKLVEITPIG-APT — KRZ 

dans laquelie X et Z sont des groupements OH ou NH 2 ou, 
dans la mesure od les proprietes immunologiques du 
peptide depourvu de ces groupes ne s'en trouvent pas es- 
se nti ell ement modifiees, des groupes comportant de 1 a 5 
residus d f acides amines, et chacun des tirets correspond 
a un residu ’ aminoacyle choisi parmi ceux qui permettent 
de conserver au peptide sus-defini les proprietes immu- 
nologiques de l'une des sequences suivantes : 

* « 

ELGDYKLVEITP1GFAPTKEKRYSSAH 
YKLVEITPIGFAPTKEK 
ELGDYKLVE I TP I GI> A PTNVKR Y T TG - 
YKLVEITPIGLAFTNVK 

6/ Peptide selon la revendication 2 caracterise 

* 

par l'une des formules : 

X VT V- YGVP -W--AT— EFCA-Z 

XVTV-YGVP-W- -ATZ 

dans laquelie X et Z sont des groupements OH ou NH^ ou, 
dans la mesure ou les propri4t4s immunologiques du 
peptide depourvu de ces groupes ne s'en trouvent pas es- 
senti el lenient modifiees, des groupes comportant de 1 a 5 
residus d'acides amines, et chacun des tirets correspond 
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a un residu aminoacyle choisi parmi ceux qui permettent 
de conserver *au peptide sus-defini les proprietes immu- 
nologiques.de l'une des sequences suivantes : 

CT Q Y VT VF Y G VPTWKN AT I P LF C AT 
VTVFYGVPTWKNAT 
CIQYVTVFYGVPAWRNAT IPLFCAT 
VTVFYGVPAWRNAT 
EKLWVTVYYGVPVWKEATTTLFCA5 


VTVYY GVP VWKEAT 

4 

7/ Peptide selon la revendication 6 caracterise 

par l r une des formules : 

CTQYVT VFY GVPTWKNAT XPLF CAT 
VTVFYGVPTWKNAT 
Cl QYVTVFYGVPAWRNAT IPLFCAT 
15 VTVFYGVPAWRNAT. . , ... 

EKLWVT V Y Y G VP VWKE ATTT LF C A S 

fc f * 

i a 

VTVYYGVPVWKEAT . 

i f B 

EDLWVT V Y Y G VP VWK E AT TTLF CAS 

* t ' 

VTVYYGVPVWKEAT 

2Q D NLWVT VYY GVP VWKEATTTLF CAS 

VTVYYGVPVWKEAT 


8/ Peptide selon la revendication 2 caracterise 

par I'une des formules : 


X -E — L-NVTE-F — W-NZ 

25 XL-NVTE-FZ 

dans laquelle X et Z sont des groupements OH ou NH^ ou t 
dans la mesure ou les proprietes inmmnologiques du 
peptide depourvu de ces gxoupes ne s*en trouvent pas es- 
sentiellement modifiees, des groupes comportant de 1 a 5 
3 q residus d'acides amines, et chacun des tixets correspond 
a un residu aminoacyle choisi parmi ceux qui permettent 
de conserver au peptide sus-defini les proprietes immu- 
nologiques de I'une des sequences suivantes : 
DDYQEITL-NVTEAFDAWNN 
c L-NVTE 








WO 88/05440 


PCT/FR88/00025 
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£ST 


3 * 



DDYSELAL -NVTESFDAWEN 
PNPQEVVLVNVTENFNMWKN 

LVNVTE 

9/ Peptide selon 

par l'une des formules : 
DDYQEITL-NVTEAFDAWNN 

L-NVTEAF 

DDYSELAL -NVTESFDAWEN 




L-NVTESF 

PNPQEVVLVNVTENFNMWKN 

LVNVTENF 

PNPQEI ELENVTEGFNMWKN 

LENVTEGF 

PNPQEIALENVTENFNMWKN 

LENVTENF 

10/ Peptide, selon 


pax l'une des formules : 


XL S-KPCVKL-PLC Z 


la revendication 8 caracterise 




la revendication 2 caracterise 


XKPCVKLTPLCVZ 
' XS-KPCVKLTPLCVZ 

dans laquelle X et Z sont des groupements OH ou NH^ ou r 
dans la mesure ou les proprietes immunologiques du pep- 
tide depourvu de ces groupes ne s'en trouvent pas essen- 
tiellement modifiees, des groupes comportant de 1 a 5 
residus d'acides amines, et chacun des tirets correspond 
a un residu aminoacyle choisi parmi ceux qui permettent 
de conserver au peptide sus-defini les proprietes iminu- 
nologiques de l'une des sequences suivantes : 


LFETSIKPCVKLTPLCVAMK 

LFETSIKPCVKLSPLCITMR 

30 

LWDQSLKPCVKLTPLCVSLK 

KPCVKLTPLCV 

KPCVKLSPLCI 

SLKPCVKLTPLCV 
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11 / Peptide selon la revendication 10 caracterise 

par I'une des structures suivantes : 

IiEETSIKPCVKLTPLCVAMK 
LFETS I KPCVKLSPLC ITMR 
5 LWD QSLKP CVKLTPLCVS LK 

LWDQSLKPCVKLTPLCVTLN 
PCVKLTPLCV 
KPCVKLSPLCI 

12/ Peptide selon la revendication 2 caracterise 

en ce qu'il contient la structure de base : 

X N-S-I C-Z 

XN-S-I-Z 

dans laquelle X et Z sont des groupements OH ou NH 2 ou f 
dans la mesure ou les proprietes immunologiques du 
^5 peptide depouirvu de ces groupes ne s'en txouvent pas es- 
sentiellement modifiees, des groupes comportant de 1 a 5 
residus d'acides amines, et chacun des tirets correspond 
- a un residu ariinoacyle choisi parmi ceux qui pexmettent 
de consexVer au peptide sus-defini les proprietes immu- 
2 q nologiques de I'une des sequences suivantes : 
NHCNTSVITESCD 
NTSVIT 

NHCNTSVIQECCD 

NTSVIQ 

25 TSCNTSVITQACP 

NTSVIT 

13/ Peptide selon la revendication 12 caractdxisd 

par I'une des formulas suivantes : 

NHCNTSVITESCD 
30 NTSVIT 

NHCNTSVIQECCD 

NTSVIQ 

TSCNTSVITQACP 

NTSVIT 

35 INCNTSVITQACP 
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NTSVIT 

INCNTSAITQACP 

NTSAIT 

14/ Peptide selon la revendication 2 caracterise 

g par l'une des formules suivantes ; 

XYC-P-G- A-L-C-N-T 2 

dans laquelle X et Z sont des groupements OH ou NH^ ou, 
dans la mesure oij les proprietes immunologiques du 
peptide depourvu de ces groupes ne s'en txouvent pas es- 
sentiellement modifiees, des groupes comportant de 1 a 5 
residus d‘acides amines, et chacun des tirets correspond 
a un residu aminoacyle choisi parmi ceux qui permettent 
de conserver au peptide sus-d6fini les proprietes immu- 
nologiques de l'une des sequences suivantes : 

15 YCAPPGYALLRC-NDT 

Y CAP AGFA I LKCNNKT . 

i 

15/ Peptide selon. la revendication 14 caracterise 

par l'une des formulas : 

YCAPPGYALLRC-NDT- 
20 YCAPAGFAIXiKCNNKT 

Y C APAGFAI LKCNDKK 
YCAPAGFAILKCRDKK 

16/ Peptide selon la -revendication 2 caracterise 

par la formule : 

25 X A-C W--Z 

dans laquelle X et Z sont des groupements OH ou NH 2 ou, 
dans la mesure oA les proprietes immunologiques du 

m 

peptide depourvu de ces groupes ne s ' en trouvent pas es- 
sentiellement modifiees, des groupes comportant de 1 A 5 
30 residus d'acides amines, et chacun des tirets correspond 
4 un residu aminoacyle choisi parmi ceux qui permettent 
de conserver au peptide sus-d6fini les proprietes immu^ 
nologiques de l'une des sequences suivantes : 
NKRPRQAWCWFKG-KWKD 
3 5 NERFKQA tf CRFGG - NWKE 
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10 


15 


20 


25 


30 


N - -MRQAHCN I SR AKWNA 
17/ Peptide selon 

par la formule suivante 
NKRPRQAWCWFKG-KWKD 
NERPKQAWCRFGG-KWKE 
N — MRQAHCNI SR AKWNA 
D — I RRAYCT INETEWDK 
I — I GQAHCN I SRAQWSK 


la revendication 16 caracterise 


18/ 


Peptide selon la revendication 2 caracterise 


par la formule suivantes : 

X-G-DPE NC-GEF-YC- N2 

XNC-GEF-YC-Z 

dans laquelle X et 2 sont des groupements OH ou NH^ ou, 
dans la mesure od les proprietes immunologiques du 
peptide depotirvu de ces groupes ne s’en trouvent pas es- 
sentiellement modifiees, des groupes comportant de 1 a 5 
residus d'acides amines, etchacun des tirets correspond 

y * f 

* • * 

a un residu aminoacyle choisi parmi ceux qui permettent 

* 4 

de conserver au peptide sus-defini les propriAtes immu- 
nologiques de l*une des sequences suivantes : 
KGSDPEVAYMWTNCRGEFLYCNMTWFLN 

NCRGEFLYCN 

GG -DPEVTEMWTNCRGEFLYCKMNWFLN 

NCRGEFLYCK 

* 

-GGDPEIVTHSFNCGGEFFYCNSTQLFN 

NCGGEFFYCN . 


19/ 


Peptide selon la revendication 18 caracterise 


35 


par l'une des structures suivantes : 
KG S D PE VA YMWTN GRGEFL Y CNMTWFLN 

NCRGEFLYCN 

GG-DPEVTFMWTNCRGEFLYCKMNWFLN 

NCRGEFLYCK 

-GGDPEIVTHSFNCGGEFFYCNSTQLFN 

NCGGEFFYCN 

-GGDPEITTHS FNCRGEFF Y CNT SKLFN 


A. 

« i* 


A. 
• * 
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NCRGEFFYCN 

-GGDPEITTHSFNCGGEFFYCNTSGLFN 

NCGGEFFYCN 

20/ Peptide selon la revendication 2 caracterise 

par I'une des formules suivantes : 

X C-I-Q-l G YZ 

XC-I-Q'IZ 

dans laquelle X et 2 sont des groupements OH ou NH 2 ou, 
dans la mesure oii les proprietes immunologiques du 
peptide depouxvu de ces groupes ne s*en txouvent pas es- 
sentiellement modifiees, des groupes comportant de 1 a 5 
residus d’acides amines, et chacun des tirets correspond 
& un residu amirxoacyle choisi parmi ceux qui permettent 
de conserver au peptide sus-defini les proprietes immu- 
nologiques ; de I’une des sequences suivantes : 

RN Y AP CHI KQ I INTWHKVGRNVY 
CHIKQII 

RNYVPCH IRQ X INTWHKVGKNVY 
CHIRQII 

T I TLPCR I XQF I NMWQE VGXAMY 
CRIKQFI 

21/ Peptide selon la revendication 20 caracteri se 

par I'une des structures, suivantes : 

RNYAPCHIKQ I INTWHKVGRNVY 
CHIKQII 

RNYVPCHIRQ I INTWHKVGKNVY 

* 

CHIRQII 

TITLPCRIKQFINMWQEVGKAMY 

CRIKQFI 

S I TLPCRIKQ I INMWQKTCKAMY 
CRIKQII 

NITLQCRIKQIIKMVAGR-KAIY 

CRIKQII 

22/ Peptide antigenique aaql . caract&rise par 

I'une des structures de base : 
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XDCKLVLKGLGMNPTLEEMLTAZ 
XD CKL VLKGL GTNPT L £ EMLT A Z 

dans lesquelles X et Z sont des groupements OH ou NH^ 
ou, dans la mesure od les proprietes immunologiques du 
^ peptide depouxvu de ces gxoupes ne s ' en txouvent pas es- 
sentiellement modifiees, des groupes comportant de 1 a 5 
residus d'acides amines, et dans lesquelles chacun des 
tixets correspond a un xesidu aminoacyle choisi parmi 
ceux qui permettent de conserver au peptide sus-defini 
les proprietes immunologiques de l’une ou 1' autre des 
sequences suivantes : 

DCKLVLKGLGMNPTLEEMLTA 
D CKL VLKGLGTNP TLEEMLT A 

23/ Sequence nucleotidique caracterisee en ce 

» 

^ qu’elle renfexme tout ou partie de la sequence d'acides 

* 1 T V 

nucleiques definie a la figure IB, 

24/ Sequence nucleotidique caracterisee en ce 

qu’elle renferme tout ou partie de la sequence d’acides 

t V 

nucleiques definie a la figure 1C. 

2 q 25/ Sequence nucleotidique selon la revendication 

23 t caracterisee en ce qu’elle comprend les sequences 
nucleotidiques : 

GAG s’etendant entre les nucleotides 550 k 2068 

1726 k 4893 
4826 k 5467 
5298 k 5633 
5637 k 5939 
8569 a 9354 
5788 a 6084 
6014 a 6130 
8296 k 8391 
8294 k 8548 
8950 a 9468 
1 a 316 
6090 a 8732 


POL 


n 


n 


it 


25 Q 
X 


30 


R 

F 

TAT-1 

ART-1 

TAT-2 

ART-2 

LTR 


II 




n 


ti 


tt 


n 


it 


IT 


tl 


It 


It 


If 


n 


it 


u 


it 


tr 


it 
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26/ Peptide ayant une structure peptidique en 

commun avec l’ossature peptidique de SIV-1, caracterise 
en ce qu'il comprend tout ou partie des sequences d'a- 
cides amines parmi les sequences suivantes : 

ENV representee a la figure 3 


GAG 

POL 

Q 

R 

X 

F 

TAT 

AHT 

27/. 


II 


If 


I) 


it 


II 


Tf 


It 


II 


II 


II 


II 


II 


41 


If 


II 


II 


5 

6 

7 

8 
9 

10 

11 


Acide nucleique recombinant caracterise en ce 

• i ■ 

qu'il comprend la totalite ou une partie d'un ADNc selon 
I'une quelconque des revendications 23 a. 25, insure dans 

t k - 

un acide nucleique provenant d'un vecteux. 

28/ Acide nucleique recombinant selon la reven- 

4 n 

dication 27, caracterise en ce qu'il est marque. 

29/ Composition antigenique contenant le peptide 

gaa selon la xevendication 26 ou 27, au moins un peptide 

qaal selon la revendication 22 ou au moins un oligomere 

% 

de ce peptide, caracterisee en ce qu'elle a la capacite 

* « 

d'etre reconnue par des fluides biologiques d'origine 
humaine, notamment des serums contenant des anticorps 
anti-HIV-2 et dans une certaine mesure des anticorps 
anti -HIV- 1 . 


30/ Composition antigenique contenant le peptide 
env selon la revendication 26 ou au moins un peptide se- 
Ion les revendications 3, 4 et 5 ou au moins un oligo- 
mere de ce peptide, caracterisee en ce qu'elle recon- 
naissent specif iquement la presence d* anticorps contre 
HIV-2. 

31/ Composition immunogene contenant tout ou par- 
22 tie du peptide env selon la revendication 26 ou au moins 
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10 


20 



30 


un peptide ou au moins un oligomere de ce peptide ou ce 
peptide sous forme conjuguee avec une molecule porteuse, 
selon les revendications 6 a 21, en association avec un 
.v^hicule pharmaceutique acceptable pour la production de 
vaccins, caracterisee en ce qu'elle induit la production 
d’ anticorps contre les susdits peptides en quantity suf- 
fisante pour inhiber efficacement les proteines du re- 
trovirus HIV-2 r voire meme le retrovirus HIV-2 entier. 
32/ Composition immunogene selon la revendication 

31 caracterisee en ce qu'elle contient les peptides dont 
les formules correspondent a des sequences qui, dans les 
glycoproteines d'enveloppe de HIV-2 , SIV-1 et HIV-1 
presentent une homologie en acides amines superieure d, 
50%. 

33/ Composition immunogene selon l’une des reven- 

■ ' * . , 4 * ^ 

dications 31 ou 32, caracterisee en ce qu’elle contient 

+ 1 ’ 

au moins un peptide ou au moins un oligomere de-ce pep- 
tide ou ce peptide sous forme conjuguee avec une mole- 

> * » * * 
cule porteuse chois i parmi env4 . env5 . env6 et envIQ . 

34/ Precede de diagnostic in vitro de 1* infection 

par HIV-2 dans un liquide biologique comprenant : 

- la mise en contact de ce liquide biologique 

avec au moins un peptide selon l’une des revendications 
1 , 2 , 3 , 4 , 5 , 22 ou un con jugue de ces peptides avec 

une molecule porteuse ou des peptides gag ou env selon 
la revendication 26. 

- la detection de la presence eventuelle d'un 
complexe antigene -anticorps par des m£thodes physiques 
ou chimiques, dans ledit liquide biologique. 

35/ Precede de diagnostic in vitro de 1* infection 

par HIV-2 dans un liquide biologique selon la revendi- 
cation 34, caractirise en ce que la detection du com- 
plexe antigene-anticorps eventuel lenient forme est rea- 
lisee gr&ce a des tests immunoenzymatiques (du type 
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ELISA) immunof luorescents (du type IFA) radioimmunolo- 
giques (du type RIA) ou des tests de radioimmunopreci- 
pitation (du type RIPA) . 

36/ Kit pour le diagnostic in vitro de 1 ' inf ection 

_ par HIV-2 dans un liquide biologique caracterisd en ce 
5 

qu'il comprend : 

- une composition peptidique contenant un peptide selon 
l’une des revendications 1 a 5, 22 , ou un melange de ces 
peptides, ou un conjugue de ces peptides avec une mole- 

.jq cule porteuse, ou les peptides gag ou env selon la 
revendication 26, 

- un reactif pour la constitution du milieu propice 4 la 
realisation d'une reaction immunologique, 

- un ou plusieurs reactifs dventuellement marque pour la 
detection du‘ complexe antigene-anticorps forme par la 
reaction immunologique, 

- un liquide biologique de reference depouxvu d f anti- 
corps reconnus par la susdite composition peptidique. 

* » ^ 

20 


25 


30 


35 
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F IG. 1 . A » 


HIV2,B0D 

» H 

GTCGCTCXGCGGAGAGGCTGGCAGATTGAGCCCTGGGAGGTTCTCTCCAGCACTAGCAGG 

• * * ♦ * * 

TAGAGCCTGGGTGTTCCCTGCTAGACTCtCACCAGCACTTGGCCGGTGCTGGGCAGACGG 

100 R i US 

CCCCACGCTTGCTTGCTTAAAAACCTCT TAATAAA. GCTGCCAGTTAGAAGCAAGTTAAGT 

+ * ' * # * * t 

GTCTGCTCCCATCrCTCCTAGTCGCCGCCrGGTCATTCGGTGTTCACCTGAGTAACAAGA 

. 200 . 

CCCTGGTCTGTTAGGACCCTXCTTGCTTXGGGAAACCGAGGCAGGAAAATCCCXAGCAGG 

....... . . . 300 

XXGCCGCCTGAACAGGGACTTGAAGAAG'ACTGAGAAGTCTTGGAACACGGCTGAGTGAAG 

• * ft • . • * 

gcagxaacggcggcaggaacaaaccacgacggagtgcxccxagaaaggcgcgggccgagg 

• • • 400 * * 

CACCAAAGGCAGCGTGTGGAGCGGGAGGAGAAGACGCCXCCGGGTGAAGGTAAGTACCTA 


caccaaaaactgxagccgaaagggcttgcxaxcctaccxtxag acagctagaagattgig 

• 500 * • * * • 

MetGlyAlaArgAsnSerVaiLeuArgGIyLysLyiAlaAspGluLeuGluAtglle 
GGAGATGGGCGCGAGAAACTCCGTCXTCA3AGGGAA4AA V3CAGXXGAATTAGAAAGAAX 

« « . * * • 600 
ArgLeuArgProGlyGlyI.yaI.yfi Lys IyrArgLi’;Ly sHic X le ValTrpAlaAlaAsn 
AGGXTACGGCCCGGCGGAAAGAAAAAGXACAGGCTAAAACATATXGTGTGGGCAGCGAA 




Lys LeuAspArgPheGlyLeuAlaClu SerteuLeuGluSer LysC luG lyCysGlnLys 
rAAATXGGACAGAXTCGGATTAGCAGAGAGCCTGXTGGAGXCAAAAGAGGGXXGTt/.AAA 

. . . 700 

I leLeuXhrValLeuAspProMetVa IProThrGlySerGluAsnLeuLyaSfcr Leu? he 
AATTCTTACAGTTXTAGATCCAATGGTACCGACAGGTTCACAAAATTIAAAAAGTGTTTT 


As athrVa ICy s 7a IXleTrpCy s I leKisAlaG luC XuLysValLysAspXhrG luGly 

XAAXACTGXCTGCGXCAIITGGIGCATACACGCAGAAGAGAAAGTGAAAGAXAC 1GAAGG • 

* 800 * » • « 
AlaLysClnl le7a lArgArgHisLeuVa lAlaGluThrGlyThrAlaGluLyaHecPrc 
AGCAAAACAAATACTGCGGACACATCIAGXCGCAGAAACACGAACTGCACAGAAAATGCC 


FIG. 1A 



WO 88/05440 


PCT/FR88/00025 


i/35 

SerThrSerArgProIhrAlaProSerSerGluLysGXyGlyAsnXyrProValGlnKia 

aagcacaactacaccaacagcaccaxciacccagaacgcaggaaatxacccactgcaa 

Va 1G1 yGlyAanTyrXbrHis I leProLeuSerProArgXhrLeuAsnAXaXrpVaXLys 
TGTAGGCGGCAACTACACCCATATACCGCTGAGTCCCCGAACCCXAAATCCCTGGGTAAA 

, 1000 * • 

LeuValGluGluLysLyaPheGlyAlaGlu Val Va lProGlyPheGlnAlaLeuSerGlu 
attagtagaggaaaaaaagticggggcagaagtactoccacgattxcaggcactctcaca 

G 1 yCysThrProTyrAspI leAsnGlnMe t LeuAsnCy s Va lGlyAspHisG InAlaAla 

AGGCTGCACGCCCTATGATATCAACCAAArGCXTAAXXGTCTGGGCGACCATCAAGCAGC 

* 1100 . • * 

MetGlallelleArgGluIlelleAsnGluGluAlaAlaGiuTrpAapValGlnHisFro 
CATGCAGATAArCAGGGAGArtATCAAXGAGGAAGCAGCAGAATGGGATGTGCAACATCC 

IleProGlyProLeuProAlaGlyGlnteuArgGluProArgGlySerAspIleAlaGly 

AATACCAGGCCCCTTACCAGCGGGGCAGCTTAGAGAGCCAAGGGGATCTGACAXAGCAGG 

^ § f 
ThrThrSerTbrVa IGluGluG InlleGlnTrpMetPheArgProGlnAsaProVa IPro 

GACAACAACCACAGTAGAAGAACAGATCCAGXGGATGTTTAGGCCACAAAATCCTGTACC 

, . 1300 • 

ValGlyAanUeTyrArgAigTtpneGlnlleClyLeuGULysCyaValArgHctTyr 

AGIAGCAAACAICIATAGAACAIGGAICCAGAIAGGAITGCAGAAGIGXGXCAGGAXGIA 

A8nProThrAanIULeuAapIleI,ysGUGlyProI.y8GluProPheGlnSetTyrVal 

caacccgaccaacaiccxagacaiaaaacagcgaccaaaggagccgticcaaagciaigt 

1400 • ♦ • * 

AfioArePhbTvrLvsSerLeuArgAUGluGlnThrAspProAlaValLysAsnXrpMet 

AGAIAGAtlCTACAAAAOCTTCAGGCCAGAACAAACAGAXCCAGCAGTGAAGAAITCGAT 

XhtGlnTlirI. e oI.euValGlnA8nAlaA8nProAapCy*l*y*I*«“Ji*l^®“J'y®®^7^® u 

GACCCAAACACTGCXAGTACAAAATGCCAACCCAGACTGXAAAXTAGTGCTAAAAGGAC 

• * • * 

' GlyHetAanPtoThrLeuGlttCIuMetLeuIhrAlsCysGlnCly ValGlyGlyProGXy 

agcgaigaaccciacctxagaagacaigcxgaccgccxgxcagggcciaggxgggccagc 

# ' « 1600 • • 

CCAGAAAGCTAGAXTAA?GCCAGAGGCCCIGAAAGAGGXCAIAGGACCXGCCCCIAICCC° 

SerAlaArgCltiCyeArgAlaProArgArgGlnGlyCy«TrpLy6CysGlyl.ysProGly 

CTCGGCAAGACAATGCCGAGCACCTAGAAGGCAGGGCTGCTGGAAGTGTGGTAAGCCAGG 

* * TbrGlyArgFhePheArgTtarGlyProUuCiy 

HialleHetTbrAanCysProAflpArgGUAlaGlyPhaleuGlyLeuGlyProTrpGIy 

acacatcatgacaaactgcccagatagacacgcaggttxtttaggactgcgcccttgggg 

4 , • * 

tysCXuAXaProCXnLeuProArgGXyProSerSerAXaCXyAXaAapIbrAenSerXlir 
LyaLysProArgAanPhePtoValAlaClnValProGUGlytettlhrProIhrAXaPro 
AAAGAAGCCCCGCAACTTCCCCGTGGCCCAACTTCCGCAGCGGCXGACACCAACAGCACC 

1900 

ProSerGXySerSetS«rGXySerXhrGXyCXaIXeTyrAXaAXaArgGXaI.y*IbrGXo 

ProVaXAapProAXaVaXAapLeuI.euCXuLyeTyrMetGXnGXnGXyLysAtgGXnArg 

cccagxggaxccagcagtggatctactggagaaaxataxgcagcaagggaaaagacagag 

ArgAXaGIuArgCXuIbrneGXnGXySerAspArgGXyteuIbrAXaProArgAXaGly 

(fig. lA-sulte i) 
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• * 

GlyAepXhr I teC InGlyAlaThrAsnArgGlyteuAlaAlaProG InPheSerLeuTrp 
GiuThrProtyrArgGluProProThrGluAspLeuLeuKisLeuAanSerLeuPheGly 
GGAGACACCATACAGGGAGCCACCAACAGAGGACTTGCTGCACCTCAATTCTCTCTTTGG 

2100 

LysArgProV^alValThrAlatyrl 1 eG luG ly G In Pro Va IGluValLeuLeuAspThr 
Lys AspG la 

AAAAGAGCAGTAGTCACAGCATACATTGAGGGTCAGCCAGXAGAAGTCTTGTTAGACACA 

• * • * • • 

GlyAlaAspAspSerlleValAlaGlylleGluLeuGlyAsnAanTyrSerProLysIle 

ggcgctgacgactcaaxagxagcaggaatagagttagggaacaattatagcccaaaaata 

• • • 2200 * • 

ValGiyGiyI LeCLyGlyPhe I leAsnXhrLysG luXyrLysAsnVa IGluI leGluVal 
GTAGGGGGAATAGGCGGATTCATAAATACCAAGGAAXATAAAAATGTAGAAATAGAAGTT 

• * * • * 
LeuAsnLysLys ValArgA laXhr I leMet ThrG lyAspXhrPro IleAsnllePheGly 
CTAAATAAAAAGGTACGGGCCACCATAATGACAGGCGACACCCCAATCAACATITTXGGC 

. 2300 . 

ArgAs nl leLeuXhrAlaLeuG lyMet SerLeuAsnLeuProVa lAlaLys ValGluPro 

acaaatattctgacagccttacgcatgtcattaaatctaccagtcgccaaagtagagcca 

• . . . . 2400 

IieLysIleMetLeuLysProGiyLysAspGlyProLysLeuArgGinlrpProleuXhr 

ATAAAAATAATGCTAAAGCCAGGGAAAGATGGACCAAAACTGAGACAAXGGCCCTTAACA 

• ••••• 
LysGluLyalleG luAlaLeuLysGluI leCysGluLysMetGluLysGluGlyGlnLeu 

aaagaaaaaatagaagcactaaaagaaaxctgigaaaaaaiggaaaaagaaggccagcta 

* * ■* 2300' • ♦' 

a 

GiuGluAlaProPtoThrAsnProTyrAsnThr ProIhrPheAlal leLysLysLysAsp 

gaggaagcacctccaacxaatccttataatacccccacaxttgcaatcaagaaaaaggac 

I J » 

# • * • * • 
LysAsnLysTrpArgMe tLeuIleAspPheArgGluLeuAsnLys ValThrGlaAapPhe 
AAAAACAAATCGAGGAIGCTAATAGATTTCAGAGAACTAAACAAGGTAACICAAGAXTTC 

* 2 6 0 0 v # * # * 

TfcrGluIleGlnLeuGlylleProHieProAiaGlyLeuAlaLysLysArgArgtleThr 

ACAGAAATTCAGTTAGGAATXCCACACCCAGCAGGGTTGGCCAAGAAGAGAAGAATTACX 

* * • * • 2700 

Va lLeuAepValGlyAapAlaXyrPheSer IleProLeuHisGluAspPheArgProTyr 
GTACTAGATGTAGGGGATGCTXACXTTTCCATACCACTACATGAGGACTTTAGACCATAT 

* • * * * * 

ThrAlaPheTbrLeuProSerValAanAsnAlaGluProGlyLysArgTyrlleTyrLys 

actgcaittactctaccatcagtgaacaatgcacaaccaggaaaaagatacaiaiataaa 

• • * 2800 * » 

ValLeuProGlaG lyTrpLyaG lySer ProAlallePheGlnHisThrHe t ArgGlnVa 1 
GTCXTGCCACAGGGATGGAAGGGATCACCAGCAATTTTTCAACACACAATGAGACAGGTA 


LeuGluProPheArgLysAlaAanLyaAspVa lllell elleG InTyrMet AspAspIl e 
TXAGAACCATTCAGAAAAGCAAACAAGGAXGTCATXATCATTCAGTACATGGATGATATC 

• 2900 » » • ' • 

Leu I leAlaSerAspArgTbrAspLeuG luHidAspArgVa IVa ILeuGlnLeuLysG lu 

ttaatagctagtgacaggacagaxxxagaacaxgatagggxagtccxgcagcxcaaggaa 

• • • * • 3000 

LeuLeuAaaGlyLeuGlyFheSerXhrProAapGluLysPheGlaLysAspFroProXyr 

cttctaaatggcctaggattttcxaccccagaxgagaagttccaaaaagaccctccatac 

* * » # * • * 

HisTrpHetG lyXyrG luLeuTrpProThr Lys XrpLysLeuG InLys IleG InLeuPro 

cactggaxgggcxaxgaacxaxggccaactaaaxggaagttgcagaaaaxacagxxgccc 

• • • 3100 * • 

GlaLysGluI leTrpTbrValAsaAsp IleGlaLys Leu ValGly Va 1 LeuAsnTr pAla 

caaaaagaaataxggacagxcaaxgacaxccagaagcxagtgggtgtcctaaattgcgca 

. Xfig.lA-suite 2) # 
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A laGlnLeuTy rProG ly I leLyaThrLyaHiaLeuCysArgLeul leArgGly LysMe t 
GCACAACTCTACCCACGCAXAAACACCAAACACIIAICIACGIIAAICAGACGAAAAATG 

. 3200 . 

ThrLeuTbrGluCluValGlnTrpTbrGluLeuAlaGluAlaGluLeuCluGluAaoArg 

ACACTCACAGAACAAGTACAGTGGACAGAATTAGCAGAAGCAGAGCTAGAAGAAAACAGA 

i • * i • 3300 

IlelleleuSerC IdGIuGIoGIuG lyHisTy r Xy rG XoGluG luLy* G luLeuG luAla 
ATTATCC-TAAGCCAGGAACAAGAGGGACACTAT.TACCAAGAAGAAAAAGAGCTAGAAGCA 

TbrValcinLysAspGluGluAsnGlurrpThrTyrLyalleHlsGlnGluGluLysIle 

agagtccaaaaggatcaagagaatgagtggacatataaaatacaccaggaagaaaaaatt 

* 

LeuLye ValG lyLys TyrA LaLys Va ILysAsnThrHieThrAstiGlyl leArgLeuLeu 
CTAAAAGXAGCAAAAXATGCAAAGGXCAAAAACACCCAIACCAATGGAATCACAITGTTA 


AXaGlnValValG InLys I XeG XyLysG XuAlaLeuVa XIXelrpG XyArglleProLya 

gcacaggxagxtcagaaaaxaggaaaagaagcacxagxcaxtxggggacgaataccaaaa 

• 3 300 • • * • 

PheHieLeuProVaXGXuArgGiulXeTrpGXuGXnXrpTrpAapABnTyrXrpCXnVal 

TTTCACCIACCAGTAGAGAGAGAAAXCTGGGAGCAGTGGXGCGAXAACTACXGGCAAGXG 

. • * . * ' 3600 

XhrTrpI XeProAepTrpAspPheVa 1 S erThrProProLeuVa lArgLeuAlaPheAsn 
ACATGGAXCCCAGACXGGGACTXCGTGXCTACCCCACCACXGGXCAGGTXAGCGXXTAAC 

LeuValGlyAepProl leProG lyAlaG XuThrPheTy rlhrAapC ly SerCya AanArg 
CTGGTAGGGGATCCXAIACCAGGXGCAGAGACCXTCTACACAGATGGATCCXGCAATAGG 

. ; * 3700 . . 

GlnSerLysGluGlyLysAlaGlyTyrVa lXhrAapArgGXyLyeAspLya ValLysLys 

caatcaaaagaaggaaaagcaggatatgtaacagatagaggcaaagacaacgtaaagaaa 

• * ♦ ft * ft- 

LeuGluG InThrThrAsnG lnG laAlaG luLeuG XuAXaPheAlaMe tAX aLeuThr Asp 
CTAGAGCAAACTACCAAICAGCAAGCAGAACTAGAAGCCTTTGCGATGGCACTAACAGAC 

'3800 • , . 

SerGlyProLya 7a lAaoliel 1 eVa lAepSerG lnTyrValMetG lyl leSerAlaSer 

xccggtccaaaagtxaaxattaiagtacacxcacagxaxgtaatgcggaxcagxccaagc 

• - . • * 3900 

GlnProTfcrGluSerGXuSerLysXleTalAasGXnllelleGluGluMet IXelaysLys 
CAACCAACAGAGTCAGAAAGTAAAATAGTGAACCAGAXCATAGAAGAAATGATAAAAAAG 

• i 3* * • * * 

GluAlallaTyrVa lAlaTrpVa IProAlaHiaLyaGlylXeG XyGlyAsnG lnG luVal 
GAAGCAATCXAXGXTGCA7GGGTCCCAGCCCACAAAGGCAXAGGGGGAAACCAGGAAGXA 

tit 4000 « • 

AspHigLeuValSerGlnGXylXeArgG InValLeuFheLeuGXtiLya I leG XuProAla 
GATCATTTAGTCAGTCAGGGTATCAGACAAGTGTTGTTCCTGGAAAAAATACAGCCCGCT 

GlnGluGluHieG XuLysTyrHisSerAanVaXLysG luLauSerHiaLysPbeGXyl Xe 
CAGGAAGAACATGAAAAATATCATAGCAATGXAAAAGAACXGTCXCATAAAXXXGGAATA 

• 4100 « * • * 

ProAauLeuVa XAlaArgGl.alXeValABnSerCysAlaGlnCyaGLaGlnLyaGXyGlu 

cccaatttagxggcaaggcaaatagtaaactcaxgtgcccaatgtcaacagaaaggggaa 

. * • . * . 4200 

AlalleHiaG lyGlaValAanAlaGluLeuG lyXhr TrpG laMe tAepCysXUrUisLeu 

GCTATACATGGGCAAGTAAATGCAGAACTAGGCACTTGGCAAAXGGACTGCACACATXXA 

* 

• ~ 'i • * • • 

GluGlylysIlellelleValAlaValHisValAlaSerGlyPhelleGluAlaCluVal 
GAAGGAAAGATCATTATACTAGCAGTACATGTTGCAAGTGGAITTATAGAAGCAGAAGTC 

i f • 4300 • 

I XeProGXnGXuSerC lyArgG XaThrAlaLeuPheLeuLeuLyaLeuAXaSerArgXrp 
ATCCCACAGGAATCACGAAGACAAACAGCACXCTTCCXAIXGAAACXGGCAAGTAGGXGG 

(f ig.lA-auite 3) 
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ProXleThrHiflLeuHisThrAspABiiGlyAlaAsnPheThrSerGlaGluVainysMet 

CCAATAACACACTTGCATACAGATAATGGTGCCAACXXCACITCACACCACGTCAAGATG 


4400 


VaUlaTrpTrpUeGlyXleGluGl.nSerPheGXyValProTyrAsaProGlnSerGU 

GTAGCATGGTGGATAGGTATAGAACAATCCXXTGGAGXACCXTACAATCCACAGAGCCAA 


4500 


GlyValVa IGluAlaMetAenHisHisLeuLysAaaGlalLeSfcrGlvThr He ValLeu 

ggagtagtagaagcaaxgaatcaccatctaaaaaaccaaataagtgaaacaatagtacta 


MetAlalleHiaCyaMetAaaPheLysArgArgGlyGlyl leGlyAspHetTbrProSer 

atggcaaxxcatxgcatgaaitttaaaagaacgggcggaaxagcggaiatgactccatca 
■ - * • » 4600 • • 

GluArgLeuI leAsnMet IleThrXhrG IuGXdG lul leGlnPbebeuGlnAlaLysAan 

gaaagatxaatcaatatgaxcaccacagaacaagagaxacaaitccxccaagccaaaaax 


Ser LysLeuLysAspPhe Arg Va lXyrPheArgG luG lyArgAspG InLeuTrpLysG ly 
TCAAAATTAAAACATTTTCGGGTCXAIITCAGAGAAGGCAGAGATCAGTTGXGCAAAGGA 

. 4700 

ProG lyGluLeuXeuTrpLyaGlyGluGlyAlaValXeuVa lLyeValGlyTtarAspIle 
CCTGCGGAACTACTGTGGAAAGGAGAAGGAGCAGXCCXAGTCAAGGTACGAACAGACAXA 

4800 

Lys 1 1 el 1 eProArgArgLysAlaLys 1 1 el XeArgAspTyrG lyGlyArgGlnG luMet 

MetGluGluAspLysArglrp 

aaaataaiaccaagaaggaaagccaagatcatcagagaciaxggagcaagacaagagaxg 

■ * J 

• * * • * ' • 

As pSe rClySerHisLeuGluGlyAlaArgGluAspG 1 yGluMetAla 
I leVa 1 Va IProThrTr pArg Va IProG lyArgMetG luXysTrpH iaSer.LeuVa ILys 
GATAGTGGTTCCCACCTGGAGGGTGCCAGGGAGGATGGAGAAATGGCATAGCCTXGTCAA 

, , * 4900 * 

TyrLeuLyaTyrLyeThrlysAapLe.uG luLys Va ICyslyrValProHisHisLysVal 
GTATCTAAAATACAAAACAAAGGATCTAGAAAAGGTGTGCTATGXTCCCCACCATAAGGX 


GlyXrpAlaXrpXrpThrCyfiSerArgPa lllePheProLeuLysGXyAsoSerSiaLeu 
GGGATGGGCAXGGTGGACTTGCAGCAGGGXAATAXTCCCAXTAAAAGGAAACAGTCATCX 

• 5000 • • • • 

GluIleClnAIaTyrXrpAsnLeuXhrProGluLysGlyXrpLeuSerSerTyrSerVaX 

AGAGATACAGCCATATTGGAACTTAACACCAGAAAAAGGATGGCICTCCTCTTATTCAGT 

• • y* • > • 5100 

ArgI leThrXrpTyrlhrGluLysPheTrpThrAspVallhrPrbAapCyaAlaAapVal 
AAGAAXAACXXGGTACACAGAAAAGXTCtGGACAGATGTXACCCCAGACTGXGCAGAXGT 


LettlleHiaSerthrTyrPbeProCysPheThfrAlaGlyGluValArgArgAlalleArg 

CCrAATACATAGCACTTATTTCCCXXGCTTTACAGCAGGTGAAGXAAGAAGAGCCATCAG 

• • * 5200 • » 

GlyG luLysLeuLeuS erCy sCy a AsnTy rProArgA laHis ArgAlaGlnVaXP ro Ser 
AGGGGAAAAGTTATTGTCCTGCTGCAATTATCCCCGAGCTCAXAGAGCCCAGGTACCGXC 


LeuGXnPheLeuAlaLeuValValVa lGluGlnAsnAapArgProGlnArgAspSerThr 

MetThrAapProArgGluTbrVa IPro . 

acttcaattxctggccxtactggiagtccaacaaaaigacagaccccagacagacagtac 

* 5300 * • * • 

ThrArgLyaGlaArgArgArgAspXyrArgXrgGlyXeuArgLeuAlaXyaGltiAapSer 
ProGlyAeaSerGlyGluG luXhrlleGlyGluAlaPheAlaTrpLauAaaArglhrVal 

caccaggaaacagcggcgaagagactatcggagaggccttcgcctggctaaacaggacag 

5400 

ArgSerHiaLyaGlnArgSerSerGIuSarProThrProArglbrTyrPheProGXy Val 

GluAlalleAsnArgGluAlaV* lAanHiaLeuProArgG luLeuI XePheG lnVa llrp 

TAGAAGCCATAAACAGAGAAGCAGTGAATCACCTACCCCGAGAACTTATXTXCCAGGXGX 

(fig.lA-suite 4 ) 
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AlaGluValLeuCluIXeLeuAla 

G InArgSerXr pArgTy rlr pH iaAapG luG XnG XyMe t SerG Xu SerXy rlhrLyaXy r 

ggcagaggtccxgcagatactgccaxgaigaacaagggatgxcagaaagtiacacaaagx 

. , . 5500 

ArgTyrLeuCy BllelleGlnLyaAlaValTyrHetllisValArgLysGlyCysXbrCye 
ATAGAIATTTGTGCATAATACAGAAAGCAGTGTACATGCATGXXAGGAAAGGGXGTACTT 

*•••** 

LeuGIyArgGlyHisGlyProGlyClyTrpArgProGlyProProProProProProPro 

GCCTGGGGAGGGGACAXGGGCCAGGAGGGTGGAGACCAGGGCCTCCXCCTCCTCCCCCTC 

• 5600 • • f • 

Met AlaGluAlaFroXhrG XuLeuProPrp Va lAspG ly THr ProLeu 
G lyLeuVal*** 

CAGGXCXCGXCTAATGGCXGAAGCACCAACAGAGCTCCCCCCGGXGGATGGGACCCCAC'T 



ArgGluProGlyAspGluTrpI le IleGlu I XeLeuArgGluIleLysGluGluAXaLeu 
GAGGGAGCCAGGGGAXCAGTGGAXAATAGAAAXCTTGAGAGAAATAAAAGAACAAGCXIT 

LysHisPheAspProArgLeuLeuIleAlaLeuG lyLyaly rlleTyrXhrArgHisG ly 

MetGXu 

AAAGCATXTTGACCCTCGCXXGCTAATTGCTCTTGGCAAATATATCTATACXAGACATGG 

• • • 5800 • • 

As pThrLeuGluGlyAlaArgG luLeu I leLys Va lLeuG lnArgAlaLeuPheThrHis 
ThrP roLeuLysAl aP roGlu Ser SarL-euLys SerCysAsnGluP roPheSerArgThr 

agacaccctxgaagccgccagagagctcatxaaagtcctgcaacgagccctxttcacgca 


PheArgAlaG XyCysG XyHi aSerArgl leG XyG inXhrArgG lyGlyAanProLeuS er 
SerGluG LnAapV.a IA laXhrGlnG luLeuAl aArgG XnG XyGXuGlu I LeLeuSerGln 
CTTCAGAGCAGGATGTGGCCAC TCAAGAATTGGCCAGACAAGGGGAGGAAATCCTCTCTC 

*..5900 • * # • 

AlalleProThrProArgAanMetGXn 

LeuTyrArgProLeuG luThrCy s As nAsnSe rCy s TyrCys Lya ArgCysCyaTyrHia 
AGCTATACCGACCCCTAGAAACATGCAATAACTCATGCTATTGTAAGCGATGCTGCTACC 

* « , . . 6000 

MetAanGIuArgAlaAsp 

CysG laMetCysPheLeuAsnLysGlyLeuGlyl leCysXyrGluArgLysGlyArgArg 
ATTGTCAGATGTGCTTTCTAAACAAGGGGCTCGGGATATGTTATGAACGAAAGGGCAGAC 

GluG XuGXyLeuG InArgLys LeuArgLeuI 1 eArgLeuLeuH IsGlnThr SerGluTy r 

Met 

ArgArgXhrProLyeLysThrLysThrHiaProSerProThrProAspLya 

GAAGAAGGACTCCAAAGAAAACXAAGACXCAXCCGXCXCCTACACCAGACAAGTGAGXAX 

« • • 6X00 * • 

AspG luSerAlaAlaXyrCysHisFhel leSer 
Me tAanGlnLeuLeuXleAlal leLeuLeuAla SerAlaCye teuVa lTy rCysThrGln 
GAXCAAXCAGCXGCTXAXXGCCATTXXAIXAGCXAGXGCXXGCTXAGXAXATTGCACCCA 


* • » 9 ■ » 

TyrValThrValPheIyrGly7alP.roIhrTr.pLyaAsaAlaIhrIXeProLeuPheCy8 

atatgtaactgixitctatggcgtacccacgiggaaaaatgcaaccatxcccctcixttg 

* 6200 • • * * 

A laThrArgAsnArgAspThr TrpG lyThr I 1 eG InCy sLeuPro AspAsnAspAspTy r 
XGCAACCAGAAATAGGGATACTXGGGGAACCATACAGXGCTXGCCXGACAAXGAXGAXXA 

6300 

GlaGlttllelhrLeuAsnVa IXhrG XuAlaPheAapAlaXrpAaaAsnXhrVa XThrGXu 
TCAGGAAATAACTTXGAAXGXAACAGAGGCXXXXGAXGCAXGGAATAATACAGTAACAGA 


• • • * * * • 
GlnAlal leC luAapVa XXrpBisLeuPheG luXhrSerl 1 eLysProCya Va XLys Leu 
ACAAGCAAXAGAAGAXGXCTGGCAXCXAXXCGAGACAXCAAXAAAACCATGXGXCAAACX 

* *(f lg.lA-sufte 5) 6400 
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ThrProLeuCysValAlaMetLysCysSerSerXhrG luSer SerXhrGlyAsnAsnlhr 
AACACCTTTATGTGTAGCAATGAAAXGCACCAGCACAGAGAGCACCACAGGGAACAACAC 

» I » I # • 

ThrSerLysSerThrSerThrThrThrThr ThrProThrAapGlDGluClnClu IleSer 
AACCTCAAAGAGCACAAGCACAACCACAACCACACCCACAGACCAGCAGCAAGAGATAAG 

• 6 300 • « • 

GluAspThrProCysAlaArgAlaAspAsnCysSerGlyLeuClyGluGiuGluThr He 

TGAGGATACTCCATGCGCACGCGCAGACAACTGCTCAGGATTGGGAGAGGAAGAAACGAT 

* 6600 
AsnCy sGlnPheAsnMe tThrGlyLeuG luArgAspLysLystysG InlyrAanCluXhr 

caattgccagttcaatatgacaggattagaaagagataagaaaaaacagtataatgaaac 

• t * * 4 * 

TrpTyrSertyflAap 7 a 17a ICyaG lu ThrAsn AonSer Thr AsnG laThrG InCysTyr 
ATGGTACTCAAAAGAXGTGGTTTGTCAGACAAATAATAGCACAAATCAGACCCAGTGrTA 

. . . 6700 

Me tAsnHisCy s AsnXhrSerVa il leXhrG luSerCy aAspLysHisTyrTrpAspAla 

catgaaccattgcaacacatcagtcatcacagaatcatgtgacaagcactaxtgggatgc 


I leArgPheArgly rCysA laProProG lyTyrAlaLeuLeuArgCyeAsnAspThrAsn 
TATAAGGTTTAGATACTGXGCACCACCGGGrXAtGCCCTAXTAAGATGrAAXGAXACCAA 

• 6 SO 0 • • • * 

Xy r SerGlyPheAlaPro AsnCy s SerLys ValValAlaSerThrCy aThrArgMetMet 
TTATXCAGGCTTTGCACCCAACXGTXCTAAAGXAGXAGCTXCTACAXGCACCAGGATGAT 
1 ♦ . ♦ - • ■ . • - • 6 900 

G luXhrGlnThr SerThrlrpFheGlyPheAeuGlyThrArgAlaGluAsnArgThrXyr 
GGAAACGCAAACTTCCACATGGTTTGGCTTTAATGGCACTAGAGCAGAGAATAGAACATA 


+ i 

I leTyrTrpHisGlyArgAepAsnArgthrllelleSerLeuAsnLyflXyrTyrAsntea 1 
XATC7AT7GGCATGGCAGAGA7AAXAGAACTAXCATCAGCTTAAACAAATATTATAATCT 

• * , * 7000 • » 

SerLeuHi aCy sLyc ArgProG lyAsnLysXhrValLysGlnlleMetLeuMet SerGly 
CAGTTTGCATXGTAAGAGGCCAGGGAATAAGACAGTGAAACAAATAATGCXTATGTCAGC 


His ValPbeHisSerBiaTyrGlnProIleAsnLyaArgProArgG InAlaTrpCysTrp 
ACATGXGTTXCACTCCCACTACCAGCCCATCAATAAAAGACCCAGACAAGCATGCTCCTG 

^ 7100 » « * • 

FheLysGlyLys TrpLya AspAlaMe t GlnG luValLysGluTbrLeuAlalysHisPro 
GTTCAAAGCCAAATGGAAACACGCCATCCAGGAGGTGAAGGAAACCCTTCCAAAACATCC 

• i • * • 7 200 

ArgXyr ArgG XyXhrAsnAapThrArgAsnl leSerPheAlaAlaProG lyLysGIySer 

cacgxatagaggaaccaaxgacacaaggaataxtagcttxgcagcgccaggaaaaggctc 


AapProGXu Va lAlaTy rMe t Xr pThrAsnCy s ArgG lyGluPheLeuTy rCy sAanMe t 
AGACCCAGAAGTAGCATACAIGTGGACTAACXGCAGAGGAGAGTTXCXCTACTGCAACAX 

• * • 7300 * » 

TbrTrpPheLeuAsnTrpIl eGluAanLysThrHisArgAsnXyrAlaProCysHialle 

gacttggxtccxcaaxtggatagagaataagacacaccgcaattatgcaccgtgccatat 


LysG lnl lei leAsnThrTrpHisLys ValG lyArgAanValTyrLeuProProArgGlu 

aaagcaaaxaaitaacacatggcataaggxagggagaaaxgtaxaxxxgcctcccaggga 

. 7400 .... 

G lyGluLeuSerCy aAflnSerThrVa IThrSerllell eAlaAsnlleAapXrpGlnAsa 
AGGGGAGCTGXCCXGCAACTCAACAGTAACCAGCATAAXXGCTAACAXTGACXGGCAAAA 

• » • * * 7 300 

AanAanG lnTbrAsnll eThrPheSerAl aGlu Va lAlaGluLeulyrArgLeuGluLeu 

caaxaatcagacaaacattacctttagxgcagacgtcgcagaacxatacagatxgcagtx 


GlyAapXyrI#yal*eu7alGlt*IleThrProIleGlyPheAlaProTbrI.ysGluLy«Arg 

GGGAGATXAXAAATTGGTAGAAATAACACCAAttGGCTTCGCACCtACAAAAGAAAAAAG 

• . * ,4 7600 » • 
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TyrSerSerAlaHiaGlyArgHiaThrArgClyValPheValLeuGlyPheLeuGlyPhe 

ATACTCCTCTGCTCACGCGAGACATACAAGACGTGTGTTCGTCCTACGCTTCTTGGGTTT 


Leu A laThrA laG XySerAl aHetG lyA 1 aAlaSerteuThr Va 1 SerAl aGXnSerArg 
TCTCGCAACAGCAGGTTCTGCAATGGGCGCGGCGXCCCTGACCGTGTCGGCTCAGTCCCG 

• 7700 t * • * 

ThrLeuLeuAlaGlyneValGlnClnGlnGlnGlnLeuLeuAepValVaUysArgGln 

gactttactggccgggaiagtgcagcaacagcaacagctgxxggacgxggtcaagagaca 

. . . . . 7800 

GlnGluLeuLeuArgLeuTbiVa lTrpGlyIbrLy»A»nI,euGlnAlaArgValXhrAl« 
ACAAGAACIGTXGCGACXGACCGTCTGGGGAACGAAAAACCTCCAGG CAAGAGTCACTGC 


* « tf • « t 

I leG luLy sty r LeuG InAspG 1 nAl aArgLeuAsuSerTrpG lyCy s A 1 aP heArgG In 
TATA GAG AAGTACCTACAGGACCAGGCGCGGCTAAAXTCATGGGGAXGTGCGXXXAGACA 

• • *.7900 ♦ , • 


Va ICysHisThrThrVa iProTrpValAanAapSerLeuAlaFroAspTrpAspAsnHet 
AGTCTGCCACACTACTGTACCATGGGTTAATGATXCCTTAGCACCTGACTGCGACAATAr 


ThrTrpG InG lu TrpG luLyaG XnValArgTy rLeuC luAlaAen XleSerLysSerLeu 
GACGTGGCAGGAATGGCAAAAACAAGTCCGCTACCTGGAGGCAAATATCAGTAAAAGTTT 

• 800 0 . * • . 

GXuG In A laG In I leG InG InG luLysAsnMet Ty rG XuLeuG XnLyeLeuAenSerTrp 
AGAACACGCACAAATTCACCAAGAGAAAAATATGTATGAACTACAAAAATTAAATAGCTG 

• > * • -■ 8100 , 
AapI XePheClyAsnTrpPheAapLeuThr SerTrpValLysXy rl leG InTyrGXy Va 1 
GGATATTTTTGGCAATTGGTXXGACTTAACCTCCTGGGTCAAGTATATTCAAXAXGGAGT 


* f 4 • ft 4 

. LeuIlelleVa lAlaVa II leA laLeuArgl 1 eVa 111 eTyrVa lVa lGlnMetLeuSer 

. / Y a i 


GCTTATAATAGTAGCAGTAATAGCTTTAAGAATAGTGATATATGTAGTACAAATGTTAAG 

. ■ . 8200 . v • 


AlaCy sPheLeuPhe ProP roArgLeuTy r-ProThr Asp 
ArgLeuArgLysG lyTyrArgProVa lPfaeSerSerProProG lyTyr IleG InG In I le 
G lyLeuGluArgAlalleG lyLeuPheSerLeuFroProProValll eSer AsnArgSer 
TAGGCTTAGAAAGGGCTATACGCCTGTTTTCTCTTCCCCCCCCGGTTATATCCAACAGAT 


ProTyrProGXnGlyProGXyThrAXaSerGlnArgArgAsnArgArgArgArgTrpLys 
Bis II eHisLysAspArgGXyClnFroAXaAf aGluG luThrGluGXuAapGXyGXySer 
IleSerThrArgThrClyAspSer GlnProThr LysLysGlnLysLy aThrValGluAla 
CCATATCCACAAGGACCGGGGACAGCCAGCCAACGAAGAAACAGAACAAGACCGTCGAAG 

. 8300 ... * 

G lnArgTrpArgGlnlleteuAlaLeuAlaAapSerlleTyrThrPheProAspProPro 
AanGlyGXyAapArgTyrTrpProTrpProIleAiaTyrlXeBiaFbeLeuXXeArgGln 
ThrValGluThrAapThrGXyProGlyArg 

CAACGGTGGAGACAGATACXGGCCCTGGCCGATAGCATATATACAtXTCCTGATCCGCCA 

..... 8400 

AXaAapSerProLeuAspGlnThrlleGlnHisLeuGXnG iyLeuThrtXeG XaGluLeu 
LeuIleArgLeuLeuTbrArgLeuTy rSer IleCy sArgAapLeuLeuSerArgSerPhe 
GCTGAXTCGGCTCTTGACCAGACTATACAGCATCTGCAGGGACTTACTATCCAGGAGCXX 

# 4 4 4 ft 4 

ProAspPToProTbrBiaLeuProGluSerGlnArgLeuAXaGXuXbr 
LeuThrLeuG InLeuIleTy rG laAsnLeuArgA apTrpL euArgLeuAr gThrAlaP he 
CCTGACCCXCCAAC7CATCTACCAGAATCTCAGAGACTGGCXGAGACXTAGAACAGCCTT 

... 8500 . • 

LeuGlaTyrG XyCyaG luTrpI leG InGluAlaPheG lnA laAlaAlaArgAlaThrArg 
MetGlyAlaSerciySerLysLyaBiaSerArgProProArgGlyLeuGlnG lu 

cttgcaatatgggtgccagtggatccaagaagcattccaggccgccgcgagggctacaac 

(f ig.lA-suite 7) 
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G lu Thr Leu A l aG lyA l aCy a ArgG lyLeuXrpArgVa ILeuG luArgl leC lyArgG ly 
ArgLeuLeuArgA 1 eArgA laG XyAlaCy sG lyGlyTy rTrpAsnG luSerGly G lyGlu 
AGACACTCTTGCGGGCGCGTGCAGCCGCTTGTGGAGGGTATTGGAACGAATCCCGAGGCG 

• 3600 * « * * 


IleLeuAlaVa IPr oArgArg I l eArgG lnG lyA laC luIleAlaLeuLeu 
TyrSerArgPheGlnC luGlySerAspArgGluG InlyaSerProSerCyaGluGlyArg 
AAIACTCGCGGTTCCAAGAAGGATCAGACAGGGAGCAGAAATCGCCCTCCTGTGAGGGAC 

• . . , # 8700 

GlnTyrGlnGlnG lyAspPheMetAsnThrProXrpLysABpProAlaAlaG luArgG lu 
GGCAGTATCAGCAGGGAGACtTTATGAATACTCCAtGGAAGGACCCAGCAGCAGAAAGGG 


LysAanLeuty rArgGlnGlxiAenMet AspAspValAspSerAapAspAspAspG InVal 

agaaaaatttgtacaggcaacaaaatatgcatcatgiacattcagaxcatgatgaccaag 


* * • 8800’* t • 

ArgValSerVa IXhrProLysValProLeuArgProHetThrHisArgLeuAlall eABp 
TAAGAGTTTCTGTCACACCAAAACTACCACTAAGACCAATGACACATAGATTGCCAATAC 


MetSerHisLeuI LeLysThrArgG lyGlyLeuG luC lyMetPheTyrSerG luArgArg 
AXATGXCACATXTAAXAAAAACAAGGGGGGGACXGGAAGGGAXGTXTTACAGTGAAAGAA 

* 8900 * • • * 

HisLyal ieLeuAsnlleTyrLeuGluLysGluGluGlyll GlleAlaAapTrpClnAau 
GACATAAAATCrTAAAIATATACTXAGAAAAGGAAGAAGGGATAAXXGCAGATTGGCAGA 

. V * . * 9000 

XyrXhrHiaG tyProGlyPa lArgTyrProMe tPhePheGtyTrpLeuXrpLysteuVa l 
ACTACACXCATGGGCCAGGAGTAAGATACCCAAIGTTCTTTGGGTGGCTATGGAAGCTAG 


ProValAapVa IProG I qG LuG lyG luAapThrG ZuThrHisCy eLeu Va 1 H IaProAla 

XACCAGXAGATGTCCCACAAGAAGGGGAGGACACXGAGACTCACTGCTTAGXACAICCAG 

• ' . . 9100 . 

GlnTbrSerLysPheAapAspProHisG lyGluThrLeuValTrpG luPbeAspProLeu 
CACAAACAAGCAAGTTTGAXGACCCGCATGGGGAGACACTAGTCTGGGAGTTTGATCCCI 


LeuAlaTy rSerTy rG luAlaPhelleArgtyrProGluG luPheGlyHisLysSerGly 
TGCXGGCXTATAGTTACGAGGCXXTTATTCGGTACCCAGAGGAATTTGGGCACAAGTCAG 

. 9200 

LeuProGluGluGluTrpLyaAlaArgLeuLys AlaArgG ly II eProPheSer 
GCCXGCCAGAGGAAGAGTGGAAGGCGAGACTGAAAGCAAGAGGAAXACCATTTAGXTAAA 

• « • * * 9300 

GACAGGAA.CAGCTATACTTGGTCAGGGCAGGAAGTAACTAACAGAAACA.GCTGACACTGC 

agggacttxccagaaggggctgtaaccaagggagggacatgggaggagcxggtggggaac 

. . * . 9400 

GCCCXCATATXCTCTGTATAAATATACCCGCTAGCTTGCATTGXACTTCGGXCGCTCTGC 

ggagaggctggcagatxgaggccxgggaggxtcxcxccagcagxagcaggxagagccxgg 

* 

* * # - ' *■ ^ — -^95 Q ^ ■* “ ‘ - | * «• * *« A * * # * * - — w ^ » V* * W * «p. *m + 

gtgttccctgctagactctcaccagcacttggccggtggtgggcacacggccccacgctt 

♦ ♦ • • *9600 

GCTTGCTXAAAAACCTCCXIAATAAAGCTGCCAGXXAGAAGCA 


(f ig.lA-suite 8) 
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no ib 


AGTCGCTCTCCCGAGAGGCTGGCAGATTGAGCCCTtGCAGGTTCTCTCCAGCACTAGCAG 

gtacagcctgggtgttccctgctagactctcaccagcacttggccggtgctgggcagagt 

100 * * 

cgctccacgcttgcttccttaaacacctcttcaataaacctgccatttagaagtaagcta 

ctgtgtgttcccatctctcct agtcgccgcctggtcaactcggtactcggtaataaaaag 

• 200 • « * * 
accctggtctgttaggaccctggtctgttaggaccctttctgctttgggaaaccgaagca 

• • 9 ’ • • 300 

ccaaaatccctaccacattgccccccgaacagcgacttgaaggacagtgagagactcctg 

agtacgcctgagtcaaggcagtaagggccgcaggaaccaaccacgacggagtgctcctag 

m 9 « 4 00 9 9 

aaaggcgcgggtcggtaccagacggcgtgaggagcggggagagaagaggcctcctggttg 

• ••••• 
cagctaagtgcaacacaaaaaggaaatagctgtcttttatccaggaaggcataataacat 

,« 500 » » « « 

GAGDrtETCLY AL AARG ASNSERV ALLEUSERGLYLYSLYS ALAASPCLULEUGLU 

agagtggcagatgggcgcgagaaactccgtcttgtcagggaagaaagcagatgaattaga 

« * * J '• 600 
. LYS JLEARGLEUARGPROCLYGLYLYSLYSLYSTYRNETLEULYSHlSVAL VALTRP ALA 

AAAAATTAGACTACGACCCGGCGGAAAGAAAAAGTACATGTT.CAAGCATGTAGTA7GGGC 

ALAASNGLULEUASPAR GPHEGL YLEUALAGLU5ERLEULEUGLUASNLYSGLUCLYCYS 
AGCAAATGAATTAGATAGATTTGGATTAGCAGAA4GCCTGTTGGAGAACAAAGAAGGATG 
/ *- , • 70.0 • * 

GLNLYSILELEUSERVALLEUALAPROLEUVALPRGTHRCLYSERGLUASNLEULYSSER 

tcaaaaaatactttccgtcttacctccattagtgccaacaggctcagaaaatttaaaaac 

♦ 

LEUTYRASNTHRVALCYSV AL ILETRPCY5 ILEHJ SAL AGLUCLULYSVALLYSHI STHR 

cctttataatactgtctgcgtcatctggtgcattcacgcagaagagaaagtgaaacacac 

• 800 • • 4 * 

GLUGLUALALYSGLNILEVAL CLNARGHJSLEUVALHETCLUTHRCL YTHRALAGLUTHR 

TGAGGAAGCAAAACAGATAGTGCAGAGACACCTAGTGATGGAAACAGGAACAGCACAAAC 

• • « • « 900 

HETPROLYSTHRSERARCPROTHRALAPROPHESERGLYARGGLYGLYASNTYRPROVAL 

TATGCCAAAAACAAGTAGACCAACAGCACCATTTAGCGGCAGAGGAGGAAATTACCCAGT 

GLNGLNILEGLYGLYASNTYRTHRHISLEUPR0LEU5ERPR0ARGTHRLEUASNALATRP 
ACAACA AATAGCTCGTAACT ATACCCACCT ACC ATTAAGCCCG AGAACATTAAATCCCTG 

• • i 1000 • * 

VALLYSLEU ILEGLUGLULYSLYSPHE GLYALAGLUVAL VAL SERGLYPHEGLNALALEU 
CGTAAAATTAATAGACGAGAACAAATTTGGACCAGAAGTAGTGTCAGGATTTCAGGCACT 

SERCLUCLYCYSLEUPROTYRASPILEASNGLNHETLEUASNCYSYALGLYASPHISCLN 
GTCAGAAGGCTGCCTCCCCT ATGACATTAATCAGATGTTAAATTGTGTGGGAGACCATCA 

9 1100 9 m • • 

ALAALAHETGLN1LEILEARGASPILE1LEA5NGLUGLUALAALAASPTRPASPLEUGLN 

AGCCGCTATGCAGATCATCAGAGATATTATAAATGAGGAGGCTGCAGATTGGGACTTGCA 

. . . * . 1200 

HI SPROGLNGLNALAPROGLNGLNGLYGLNLEUARGGLUPROSERGLYSER ASP1LEALA 
GCACCC ACAACAAGCTCC ACAACAAGGACAGCTTAGGGAGCCGTCAGGATCAGATATTGC 


GLY7HRTHR5ERTHRVALGLUGLUCLNILEGLNTRPHETTYRARGGLNGLNASNPROILE 
AGCAACAACT AGTACAGT AGAAGAACAAATCCAGTGGATGTACAGACA ACAGAACCCCAT 

« « • 1300 • • 
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PROVALCLYASNILETYRARCARCTRPIUECLNLEUCUYLEUCLNLYSCYSVALARCNET 

ACCAGTACCCAACArTTACAGGAGATCCATCCmTGCGCTTCCAAAAATGTGTCAGAAT 

• « f « * • 

T YRA$NPROTHRA$NI LELEUA 5P VALL YS GLNCL YPROL Y$GLUPRQPHEGIN$ERTYR 

ctataacccaacaaacattctagatgtaaaacaagggccaaaagagccatttcagagcta 

• 1400 - « « * « 

VALASPARGPHETYRLYS SERLEUARG ALAGLUGLNTHRASPPROAL AYALLYSASNTRP 

TGTAGACAGGTTCTACAAAACTTTAAGACCAGAACAAACAGATCCAGCACTAAAGAATTG 

• • » ♦ « 1500 

ttETTHRGLNTHRLEUtEUItEGLNASNALAASNPROASPCYSLYSLEUVALLEULYSGUY 

GATGACTCAAACACTGCTGATTCAAAATGCTAACCCAGATTGCAAGCTAGTCCJCAACGG 

LEUGLYTHRASNPROTHRLEVJGtUGLUMETLEUTHRAL ACYSGLNGLYVALGLYGLYPRO 

gctccgtacgaatcccaccctagaagaaatgctgacggcctgtcaaggagtaggggggcc 

• * i lbOO • t 

GLYCLNL YSAL AARGLEUMET ALAGLUAL ALE ULYSG LUALALEUALA PROALA PRO ILE 

AGGACAGAAGGCTAGATTAATGGCAGAAGCCCTGAAAGACCCCCTCGCACCAGCGCCAAT 

POLVALLEUGLULEUTRP 

PROPHEAL AACAALAGLNGLNLYSGLYPROARGLYSPRO ILEL YSCYSTRPASNCYSGIY 
CCCTTTTGCAGCAGCCCAACAGAAGGGACCAAGAAAGCCAATTAAGTGTTGGAATTGTGG 

• 1700 . 

GLUGLrARGTHRtEUCYSLYSALA«eTGLNSERPR0LY5LYSTHRGLY«6TLEUGLUrtET 

LYSGLUGLYH ISSERALAARGGtNCYSARGALAPROARGARGGLMGLYCYSTRPLYSCYS 
GAAGCAAGGACACTCTGCAAGGCAATGCAGAGCCCC AAGAACACACOCATGCTGGAAATG 

• • * « 1600 

TRPLYSASHGLYPROCYSTYRGLYGLNMETPROLYSGLNtHRCLYGLYPHEPHEARGPRO 

glylysmetasphisyalmet alal ysc ys proasnargglnalagl ypheleuclyleu 

TGGAAAAATGGACC ATGTTATGGCC AAATGCCCAAACAGACAGGCGGGTTTTTTAGGCCT 

TRPPROLEUGt.YtYSGLUAtAPROGLNPHEPROHrSGCrseRSERALASERGLYALAASP 

GtYPROTRPGLYLYSLYSPROARGASNPHEPROMETALAGLNVALHISaNCLYLEUTHR 

TGGCCCTTGGGGAAAGAAGCCCCCCAATTTCCCCATGGCTC'AAGTGCATCAGGGGCTGAC 

« • • .1900 • • 

ALAA5NC YS SERPROARG ARGTHR 5ERCYSGL Y SERALALY5 GlUL EUHJ SALALEUGLY 
PRQTHRALAPROPROGLUGLUPROALAYALASPtEUUEULY5ASNTYRHETHr$LEUGLY 
GCCAACTGCTCCCCCAGAAGAACCAGCTCTGCATCTCCTAAACAACTACATGCACTTCGG 

« • • • • • 

GINAIAALACLUARGIYSGLNARGGLUALALEUGLNGLYGLY ASP ARGGLYPHEALAALA 
LYSGLNCtNARGCLUSERARGGLYLYSPROTYRLYSGtUVALTHRGLUASPLEULEUHIS 
C A AGCAGC AGAGAGAAAGCAGAGGGAAGCCTTACAAGGAGGTGACAGAGGATTTGCTGCA 

• 2000 # • • * 

PROGLNPHESERLEUTRPARGARGPROVALYAtTHRALAHISlLEGLUGLYCLNPROYAL 
LEUASNSERLEUPHEGLYGUYASPGLN^ 

CCTCAATTCTCTC7TTGGAGCAGACCAGTACTCACTGCTCATATTGAAGGACAGCCTG7A 

• . . • . 2100 

GLUVALLEULEUASP7HRGtrALAA$PA5P5ERlLEVAL7HRGL7ILECLULEUGLYPR0 
GAAC7A7TAT7AGA7ACACGG6C7GA7GA77C7AT7G7AACAGGAA7AGAC77AGC7CCA 

• ••••• 
HIS7YR7HRPR0L7S ILE YALGLYGLYILEGLYG1.YPHEILEASN7HRLYSGLU7YRLY5 
CAT7 A7 ACCCC AAAAA7AG7 AGG AGCAATAGGAGGTTTTATTAATACTAAAGAATACAAA 

« * • 2200 * • 

ASNYALGUUILEClUYALLEUGLYLYSARGrLELYSGLY7HRlLE«E77HRGtYASP7HR 
AATGTAGAAA7 AGAAGTTT7AGGC A AAAGGATTAAAGGGACA ATCATG AC AGGGGAC ACC 

PRO ILE ASN ILEPHE GLYARGASNLEULEUTH RALALEUGIYMETSERLEUASNLEUPRO 
CCCA77AACA77777GG7AGAAA777AC7AACACC7C7CGCCATC7C7C7AAA7C77CCC 

• 2300 * • « « 

I LEALALYS VALGLUPROVALL YS SE RPROLEUL YSPROGLYLYSASPGLYPROLYSLEU 
A7AGC7AAGG7AGAGCC7G7AAAG7CGCCC77AAAGCCAGGAAAGGA7GGACCAAAA77G 

* • • • * 2^00 

LYSGLNTRPPR0LEU56RLYSGLULYSlLEYALAbAtEUARGGlUTLECYSCLULY3HE7 
AAGCAG7GGCCA77A7CAAAAGAAAAGATAG7TGCA7TAAGAGAAATC7G7GAAAAGA7G 
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• ♦ 12/35 . 

CLULY5A5PGLTGINLEUCIUGLUAIAPR0PR0THRA$NP*QT YRASNTHRPROTHRPHE 

GAAAAACATGGTCAGTTGGAGGAAGCTCCCCCCACCAATCCATATAACACCCCCACATTT 

• • * 2500 - « • 

ALA ILeiY5LY$iySASPLYSA$NLYSTRPARGM£TL£ UZLEASPPHE ARCGLULEUASN 
GCTATAAAGAAAAACGArAAAAACAAATGGAGAATGCTGATAGATTTTAGGGAACTAAAT 

• « • • • • 
ARGVALTHRGUNASPPNE THRGLUVALGLNIEUGLY ILEPROHI SPRQALAGL YlfUALA 

agggtcactcaagactttacgcaactccaattacgaataccacaccctgcaggactagca 

• 2600 t • « * 

LYSARCCYSARG fLETHRVAtLEUA SPH-EGLYA SPALA TYRPHESER JLEPROtEUASP 
AAAAGGAAAACCATTACAGTACTGGATATAGGrCACGCArAmCTCTATACCTCTAGAT 

• . , . • 2700 

GLUGLUPHEARGGINTYRTHRAIAPHETHRLEUPROSERVALASNASNALAGLUPROGIY 
CAAGAATTTAGCCAGTACACTCCCTTTACTTTACCA7CAGTAAATAATGCACAGCCAGCA 

LYSARGTYRILETYRLYS VALLEUPROGLNGLYTRPLYSGLYSERPROALAILEPHECLN 
AAACGATACArTTATAAGCTTCTGCCTC AGGGATCGAAGGGGTCACCAGCC ATCTTCC AA 

• • • 2 BOO • • 

TYRTHRHETARGHISVAU-EUGLUPROPHEARCLYSALAASNPROASPVALTHRLEUVAL 
TACACTATGAGACATGTGCTAGAACCCTTCAGGAAGGCAAATCCACATGTGACCTTAGTC 


GLNrYRrtETASPASPn.ELEUlLEALASERASPARGTHRASPL£UGLl;H!sASPARGVAL 
CAGT ATATGGATGACATCTTAATACCTAGTG ACAGGACAGACCTGG AAC ATGACAGGGTA 

• 2900 • • /• • 


VALLEUGUNLEULYSGLULEUUEUASN5ER1 LEGLYPHESERSERPR0GLUGUULY5PHE 

/ cttttacagttaaaacaactcttaaataccatagogttttcatccccagaagagaaattc 

. . : • « , 3000 


CLNLYS A5PPR0PR0PHE CLNTRPflE.TGCYTYRGLULEUTRPPROTHRL YSTRPUYSLEU 
CAaAAACATCCCCCATTTCAATGCATCCGGTACGAATTGTGCCCCACAAAATGGAAGTTG 



glnlysilegluleuproglnarcgluthrtrpthrvalasnaspileglnlysleuval 

caaaagatagagttcccacaaagagagacctcgacactgaatgatatacagaagttagta 

. 3100 * « 

GLYVALLEUASNTRP ALAALACtNILETYRPROGLY fLELYSTH RL YSHI5LEUCYSARG 

ggagtattaaattgcgcagctcaaatttatccaggtataaaaaccaaacatctctgtagg 



LEUlLEARGGLYLYSttETTH RLEUTNRGLUGLUV ALGLNTRPTHRGLUMETALAGLUALA 

ttaattagaggaaaaatcactctaacagaggaagttcagtggactgagatggcagaagca 

• 32 00 • » • • 

CLUTYRCLUGLUA5NLY5 IL E1L ELS USE RGLNGLUGLNGtUGL YCY 5 TYRTYRGLNGLU 

caatatgaggaaaataaaataattctcagtcagcaacaagaaggatgttattaccaacaa 

• • • * • 3300 

SeRLYSPROLEUCLUAtATHRVALiLELYSSERGtNASPASNClNTRPSERTYRLYSltE 
AGCAAGCCATTAGAAGCCACGGTGATAAACAGTCAGGACAATCAGTGGTCTTATAAAATT 


HI SGLNGLUASPLYSILEtEULYSVALGLYLYSPHEALALYSILELYSASNTHRHISTHR 
CACCAACAAGACAAAATACTGAAAG7AGGAAAATTTGCAAAGATAAACAATACACATACC 

• • • 3400 • * 

ASNGLYVALARGIEOIEUALAHIS VALILEGLNLYSIIECLYLYSCLUAIA ILEVALILE 
AATGGAGTTAGACTATTAGCACATGTAATACAGAAAATAGGAAAGGAAGCAATAGTGATC 

• * * • I I 

TRPGLYGLNVALPROLYSPHEHISLEUPROYAtGtULYSASPVAtTRPCLUGLNTRPTRP 
TGGGGACAGGTCCC AAAATTCCACTTACCAGTTGAGAAGGATGTATGGCAACAGTGGTGG, 

• 3500 « • • • 

THRASPTYRTRPCLNVALTHRTRPILEPROCLUTRPASPPHE It eserthrpro proleu 

acagactattgccaggtaacctgcataccggaatgggatttcatctcaacaccaccatta 

• • * • • 3600 

VAtARGtEUVALPHEASNLEUVALLYSASPPROlLEGLUGLYGLUCLUTHRTTRTYRVAL 
CTAACATTAGTCTTCAATC7 AGTGAAGGACCCTATAGAGGGAGAAGAAACCT ATTATGTA 

ASPGLYSERCYS SERLYSGINSERLYSGLUGL YLYSALAGtYTYRILETHRASPARCGLY 

gatggatcatgtagtaaacagtcaaaagaacgaaaagcaggatatatcacagacaggggc 
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• • • 3700 • • 
Lr$A$PLY$VALlY$VALLEUGLUGLNTHRTHRASNCLNGLNAlAGl.UUUCLUALAPHE 
AAAGACAAGCTAAAAGTGT7AGAACAGACTACTAArCAACAAGCAGAATTGGAAGCATTT 


LfUME TALALEUTHRASP SERGt YPROLYSALAA SN ILE ILF VALA 5P SERGLNTYR VAL 
CTCATGCCArTGACAGACTC AGGGCC AAAGCCAAATATTATAGTAGACTC ACAATATGTT 

• 3800 * . . . 

7GLYILE HE 7HRGL YCY5PR07HRGLU5ERGLU5E RARGLEUVALASNGLNILE HE 

atgggaataataacaggatgccctacagaatcagagagcaggctagttaaccaaataata 

• * • * * 3900 

GLUGLUME7HELY$LY$7HRGLUHE7 YRVALALA7RPVALPRGALAHISL Y$ CL Y HE 
CAAGAAATGATCAAAAAGACAGAAATTTATGTGGCATGGGTACCAGCACACAAAGGTATA 


CLYCL Y AS NGLNCLU HE AS PHI SLEUVALS ERCLNGLY HE ARGGLNVALLEUPHELEU 
GCAGCAAACC AAGAAAT AGACCACCT AG TT AGTCAAGGG AT7AGACAAG7TCTCT7CTTG 

• * • 4000 « « 

GLULYS ILEGLUPROALAGLMCUJCLUH I SSE RL YSTYRH X S SERASN HEL YSCtULEU 
GAAAAGATACAGCCACCACAAGAAGAACATACTAAATACCATAGTAACATAAAAGAATTG 


valphelyspheglyleuproargleuvalalaiysclnilevalaspthrcysasply s 

CTATTCAAATTT GGA7TACCCAGACT AGTGGCCAAACAGATAG7AGACACATG7GATAAA 

• 4X00 • t i i 

CYSHI SGLNLYSGLYGLUALAILEHI SGLYGLNVALAS NSER ASPLEUGLYTHR7RPGLN 
TGTCA7CAAAAAGGACAAGCTATACATGGCCAGGTAAATTCACACCTA0GGACT7CCCAA 

» • • « • 4200 

HETASPCYS7HRHI$LEUGLUCLY'LYSILEVAULEVALAUVALHtSVALALASERGU 
ATGCA77G7ACCCATCTAGAGCCAAAAATAGTCATAGTTGCAGTACATG7AGC7AGTCCA . 


PHE ILEGLUALAGLUVAL ILEPROGLNGLUTHRGLYARGGLNTHRALALElIPNELEULEU 
7TCA7AGAAGCAGAAG7AA7TCCACAAGAAACAGGAAGACAGACAGCACTA7T7CTCT7A 

. . 4300 

LYSLEUALASERARG7RP PROILETHRHISLEUHISTHRASPASNGtYALAASNPHEALA 
AAA7TGGCAAGCAGA7GCCCTATTACACATCTGCACACAGATAA7GGTGCTAACTTTGCT 


■ o • ■ • * * 

SERCLNGLUVALLYSMETYALALA7RPTRPALAGLYH6GLUHISTHRPHEGLYVALPR0 

TCGCAAGAAG7AAAGA7GGTTGCATGGTGGGCAGGGATAGAGCACACCTT7GGGG7ACCA 

• 4400 • • • • 

TYRASNPROCLNSERGLNGlYVALVALGLUAlArtETASHHISHISLEUtYSASNCLNILE 
TACAATCCACAGAGTCAGGGAGTAGTGGAAGCAATGAATCACCACCTGAAAAATCAAATA 

* • « • • 4300 

ASPARG 1LEARGCLUGLN ALAASNSER VALGLU7H RILE VALLE UHET ALA YALHJ SCYS 
GATAGAATCAGGGAACAAGCAAAT7CAGTAGAAACCATAG7ATTAATGGCAGTTCATTGC 


• +■ 


* 


rtETASNPHEir3ARGARCCLYCLriLEGLYASPHETTHRPR0ALACLUARCl.EUU.EASN 

ATCAATTTTAAAACAACGCCAGCAATACCCCATATCACTCCACCAGAAACATTAATTAAC 

• • • 4600 • • 

RETILETHRTHRCLUGUfGLUILEaNPHEGLNGtNSERLYSASNSERLYSPHELYSASN 
ATGATCACT ACAGAACA AGAAA7ACAA7T7CAACAA7CAAAAAAC7CAAAA7T7AAAAA7 

pheargyaltyrtyrarggluglyargaspglnleutrplysglyproclycluleuleu 

TTTCGGGTCTATTACAGAGAAGGCAGAGATCAGCTGTGGAAGGGACCCGGTGAGCTATTC 

• 4700 « * • * 

TR PL ysglygluclyalavalileleulysvalglythraspilelys valval proarc 

7GGAAAGGGG AACGAGC AG7CATC7TAAAGG7 AGG AAC AG AC AT7AAGG7AGTACCC AGC 

• * • • • 4800 

ARGLYSALALYS iLElLELYSASPTYRGLYGLYGLYLYSGUJrtETASPSERSERSERHIS 

QflETGLUGLUGLULYSARGTRP tlEVALVAUPROTHR 
AGAAAGGCTAAAA7TA7CAAAGA77ATGGAGCAGGAAAACACA7GGATAGTAGTTCCCAC 


nETGLUASPTHRGLYGLUALAARGGLUVALALA 

TRPARCItEPROCLUARGLEUGLUARCTRPHISSERLEUlLELYSTYRLEULYSTYRLYS 

ATGGAGGATACCGGAGAGGCTAGAGAGGTGGCATAGCCTCATAAAATATTTGAAATATAA 

• • • 4900 • • • 

C f 12* iB-aui t*» 3 ) 
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THRLYSASPLEUGINIYSALACYSTYRVALPRQHISHI SLYSYAlCLYTRPALATRPTRP 
AACTAAAGATCTACAAAAGCCTTGCTATCTGCCCCATCATAAGCTCGCATGGGCATCGTG 

THRCY53ERARGYAL ILEPHEPROLEUGLNGtUCLYSERHl SLEUGIUVALGLNCLYTYR 
GACCTGCAGCAGAGTAATCTTCCCACTACAGGAAGGAAGCCATTTAGAAGTACAAGCGTA 

• 5000 • • • • 

T RPASNi.EUfHRPROGLUARCCLYTRPLEUSERTHRTYRAL AVAL ARGI LETHRTRPT YR 
TTGGAATTTGAC ACCAGAAAGACGGTGCCTC AGTACTTATGCAGTG AGGATAACCTGGTA 

. . « . « 5100 

SERLYS ASPPHETRPTHRASP VALTHRPROCLUTYRALAASP ILELEULEUHt SSERTHR 

ctcaaaggacttttggacagatctaacaccagaatatgcagatattttactccatagcac 

tyrpheprocysphethralaglycluvalarcargalailearcclygluargleuleu 

TTATTTCCCTTGCTTTAC AGCGGGAGAAGTG AGAAGGGCC ATCAGGGGAGAACGACTGCT 

« * * 5200 * • 

SERCYSCYSARCPHEPROARCALAHISLYSHISCLNYALPROSERLEUGLNTYRLEUALA 

GT CTTGCTGCACGTTCCC AACAGCTC AT A AC C ACC AGGTACC A AGT CT AC AGTACTTAGC 

LEUARGVALVAL5ERH3 SVAL ARGSERGLNGLY CLUA SNPROTHRTRPLYSGLNTRPARG 

X MET SE RASP PROARGGLUARGILE PR0PK0GIYASNS6RGLYGIU 
ACTGAGAGTAGT AAGTC ATGtC AG ATCCC AG GCAGAC AATCCC ACCTGGAAACAGTGGAG 

• 5300 « « « • 

ARG ASP ASNAR GARGSERL EUAR OVAL ALALYSCLNASNSERARGGLYASPLYSCLNARG 
GLUTHRILEGCYGLUALAPHEGLUTRPLEUASNARGTHRVAtGLUG^UlLEASNARCGLU 
AAGAGACAAT AGGAGAAGCCTT CG AG7GGCT AAACAGAACAGTAGAGGAGATAAACAGAG 

• ■ ■ • » • ■ « • 5 A 00 

glyglylysproprothrgluglyalaasnpheproglyleualalysvaueuglyile 

ALAV ALAS NH ISLE UPROAR GGLULEU I LEPHEGLNVALTRPCLNARGSERTRPCLUTYR 
AGGCGGTAAACCACCTACCCAGGGAGCTAATTTTCCACGTTTGGCAAACGTCTTGGGAAT 

* 4 . * * * 

• 1 « . • 0 4 

LEUALA 

‘TRPHISASPGLUGLNCLYWETSERGLNSERTYftTHRLYSTYRAftCTYRLEUCYSLEUlLE 

ACTCGCATGATGAACAAGCGATCTCACAAACCTATACAAAATACACATACTTGTGTTTAA 

• * • 5500. • • 

GLNLYSALALEUPHEKETHI SCYSLYSLYSGLYCYSARGCYSLEUGLYGLUGLYHISGLY 

tacaaaagcctttatttatgcattgcaagaaagcctgtagatgtctaggggaaggacacg 

• * « * • I 

ALAGLYGLYTRPARGPROGL YPROPROPROPROPROPROPROGLYLEUALA R «ETCLU 

gggcagggggatggacaccaggacctcctcctcctccccctccaggactagcataaatgg 

• 5600 • « * * 

gluargproprogluasncluclyproglnarggluprotrpaspglutrpvalvalglu 

aagaaagacctccacaaaatgaaggcccacaaagggaaccatgggatgagtgggtagtgg 

• * « 5700 

valleulysgluleulysgluglualale ulyshispheaspproargleuleuthrala 
aagttctgaaagaactgaaagaagaagctttaaagcattttgatcctcggcttctaaccg 

« • • « • * • 

ml METCLUTHRPR0LEUARCGIUGLNCLUA5NSER 
LEUCLY ASHHISILETYRASNARGHISGLYASPTHRLEUGLUGLYALAGL YGLULEUfLE 
CACTTGGTAATCATATCTATAATAGACATGGAGACACCCTTGAGGGAGCAGGAGAACTCA 

• . . 5600 

LEUGLUSERSERASNGLUARGSERSERTYRILESERGLUALAALAALAALAILEPROGLU 
ARGILELEUGLNARGALALEUPHElLEHl SPHEARGSERGLYCYSSERHI SSERARGILE 

ttagaatcctccaacgagcgctcttcatacatttcagaagcggctgcagccattccagaa 

seralaasnleuglyglugluileleuserclnleutyrargproleuglualacystyr 

GLYGLNPROGLYGLYGLYASNPROLEUSE RTHRILE PROPROSERARG SERMETLEU 

tcggccaacctgggggaggaaatcctctctcaactataccgccctctagaagcatgctat 

• 5900 « • * * 

ASNTHRCYSTYRCYSLYSLYSC YSCYSTYRHISCYSGLNPHECYSPHELEULYSLYSGLY 

aacacatgctattggaaaaagtgttgctaccattgccacttttgttttcttaaaaagggc 

• * * i • 6000 

LEUCLYILESERTYRGLULYSSERHI SARGARGARGARGTHRPRGLYSLYSALALYSALA 
. ARTlrtETARCSERHISTHRCLYGLUGLUGLULEUARGARCARCLEUARCLEU 

(f Ig.lB-sui te 4) 
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V 

*■ 


* 


i 


♦ . ■ * 


4 


i 


TTOOCCATAAOTTAT GAG A ACT cacacaggagaagaaga actccgaagaaggct aacgct 
ASNThRSERSERALASERASNGLU 

ILEHlSLEULEUHISGLNTMRSERLYSTYRGLyLEUSERTRPLYSSERALAALATYRAfiG 

ENV ttETGL YCYSLfUGLYASNGLNLEULEUILE ALA 
AATACATCTTCTGCATC AAACG ACT AAGTATGGGTTGTCTTGCAAATCACCTGCTT AT CG 
• • « 6100 « * 

M ISLEULEU 

JLECYSSE RLYSCYSLEUTRPILE ILECYS ILECLNTYRVALTHRVALPHETYRGLYVAL 
CCATCTCCTCTAACTCTCTATCCATTATTTCTATTCAATATCTCACACTCTTTTATCCTC 

PRQALATRPARCASNALATHRILE PROLEUPHECYSALATHRLYSASNARCASPTHRTRP 

taccaccttccacgaatcccacaattcccctcttctctccaaccaacaatacccatactt 

* 6200 • • * • 

GLYTHRTHRGLNCYS LEU PROA SPAS NAS RASP TYRSERCLULEUAL ALE UASNYALTHR 

CCCCAACAACTCACTGCCTACCACATAATGATCATTATTCACAATTGGCCCTTAATCTTA 

* 

» • * • « . 6300 

CLUSERPHEASPALATRPCLUASNTHRVALTHRGLUGLHALAJLECLUASPVALTRPCLN 

cagaaacctttgatgcttgcgacaatacagtcacagaacaggcaatagagcacgtatcgc 


leuphegluthrserjulysprocysvallysleuserproleucysiiethrmetarc 
AACTCTTTGAGACCTCAATAAAGCCTTGTGT aaaattatccccattatgcattactatga 

« i * 6*00 * • 

cysasnlyssercluthrasplystrpclyleuthrlysseaserthrthrthralaser 

gatgcaataaaagtcagacagataaatggggattgacaaaatcatca$caacaacagcat 


< thrthrthrthrthrthralalysservalcluthrarcaspilevalasncluthrssr 
caacaacaacaacaacaacagcaaaatcagtacacacaagagacatagtcaatcacacta 


* 6600 « , • • * 
PROC YSVALVALHI SASP ASNCYSTHRGLYLEUGLUGLNGLyPROrtETlLESERCYSUYS 
GTCCTTGTGTAGT7CATGATAATTGCACAGGCTTGGAACAAGAGCCAATGATAAGCTGTA 
• • « , • * 6600 
PHEASNrtETTHRGLYLEl/CYSARGASPLYSLYSLYSCLUTYRA-SNGLUTHRTRPTYRSER 

aattcaacatgacagccttaaaaacacacaagaaaaacgagtacaatcaaacttggtact 


ALAASPLEUYALCTSGLtJGLNGLYASNSERTHRGLYASNCLUSERARGCYSTtRnETASN 

ctgcagatctggtttgtgaacaagggaatagcactggtaatgaaagtagatgttacatga 

* * • 6700 « ♦ 

HISCYSASNTHRSERYALILEGLHGIUCYSCYSASPLYSASPTYRTRPASPALAILEARG 

atcactgtaatacttctgttatccaacactcttctgacaaagattattgggatgctatta 


CYSARGTYRC Y3ALAPROPROGLYTYRALALEULEUARGGYSA5NASPTHRASNTYR5ER 

gatctagatattgtgcacctccaccttatgctttgcttagatgtaatgacacaaattatt 

• 6600 t • t • 

CL YPHErtETPROASNC YSSERLYS VALVAL YALSERSERCtSTHRARGrtETMETCLUTHR 

caggctttatgcctaactgttctaaggtagtggtctcttcatgcacaaggatgatggaga 

* • * • • 6900 

GLNTHR5ERTHRTRPPHE ARGPHEASNGLYTHRARCALAGLUASNARGTHRTYRILETYR 

cacagacttctacttggtttcggtttaatocaactagagcagaaaatagaacctatattt 

TRPH!SGLYARGASfASNARGTHRlLEILES£RLEUA$NLYSHI5TYRASNLEUTHRnET 

actggcatcgtacacataataggactataattagtctaaataagcattataatctaacaa 

* • » 7000 # * 

LYSCYSARGARGPR0GLYASKLYSTHRVAUEUPR0VALTHR1LEHETSERAULEUVAL 

tgaaatctagaagaccaggaaataagacagttttaccagtcaccattatgtctgcattgg 

P H6H I S SERGLKPROY AL AS NCLOARG PROL YSGLNALATRPCrSARGPHEGL YGL YASN 
TTTTCCACTCACAACCAGTCAATGAGAGGCCAAAGCAGGCATGGTGTAGGTTTGGAGGAA 
« 7X00 • « • » 

trplysglualailelysgluvally$glnthrilevauyshisproarctyrthrgi.y 

attggaaggaggcaataaaagaggtgaagcagaccattgtcaaacatcccaggtatactg 

• • t , « • 7200 

THRASNASNTHRASPLY51LEASNLEUTHRAUPR0ARGGLYGLYASPPR0GLUVALTHR 


caactaacaatactgataaaatcaatttgaccgctcctacacgaccacatccgcaagtta 


V 
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PHe«TTRPTHR*SHCYS*RCCLrCLOPHei£UTY*CTStrS«T*SHTWFHaSU»SH 

CCTTCA fGTGGACAAATT GCAGAGGAGACTT T CTCT AC TGTAAAATGA ATTGCTTTCT ** 

. , 7300 

TRPVALGLUASPARGSERLeUTHRTHRGLNUYSPROLYGCLUARGHtSLYSARGASNTYR 

AITCGGTAGAAGATAGGAGTCTAACTACCCAGAAGCCAAACCAACGGCATAAAAGGAATT 

• • * * 
VALPR0CYSH1 S1LEARGGLNI LE ILEASNTHRTRPHI SLYS YALGL YLYSASNVALTYR 
ACGrACCATCTCATATTAGACAAATAATCAACACTTGGCATAAAGTAGGCAAAAATGTTT 

7^00 • • • * 

. . . • 7500 

ILEASNTRPTHRASPGLYASNGlNTHRSERrLETHRNETSERAUGLUVALALACLULEU 

ACATAAATTGCACTGATGGAAACC AAACT AGT ATCACC ATGAGTGCAG AGGTGGCAGAAC 

• • • * # 

TYftARGLEUCLULEUGLYAS?TrRLY5L£UVALCLUILETHRPR0REGLYL£UALAPR0 
TGTATCC ATTGGAATTCGGAGATTATAAATTAGTAGAAATCACTCCAATTGGCTTGGCCC 

, * 7600 * 

THRASNVALLYSARGTYRTHRTHRGLYGLYTHRSERARGASNLYSARCCLYVA1.PHEYAU 

CC ACAAATGTCAAGACGT AC ACT ACTGGTCGC ACCTCA AG AAAT AAAAGAGGGGTCTTTG 

• • • * * 

tEVGLYPHELEUGLYPHELEUALATHRAL ACLYSER ALAHETGLYALAALAS6RLEUTHR 

TGCTAGCGTTCTTGGGTTTTCTCCCAACCGCACGTTCTGCAATGCGCGCGGCCTCGTTCA 

VALTHRALAGLN$ERARGTHRL£ULEUALAGLY ILE YALGLNGLNGLNGtNGLNUEULEU 

CCGTGACCGCtCAGTCCCGGACTTTATTGGCTGCGATAG.TGCAGCAACAGCAACAGCTGT 

; ♦ 7900 • • 

CLYCY5 ALAPHEARGGLN YALCYSH1STHRTHRVAL PROTRPPROASNALASERLEUTHR 

GGGGATGTCCGTTTAGACAAGTCTGTCACACTACTGTACCATGGCCAAATGCAAGTCTAA 

* . woo . * ^ 

TAT2 ARC PROI LE PROA SNARGlLEAR6LEUCYSGI.NPR0LYSt.YS ALA 

art2yalaspprotyrprothrgly$erglyseralaasnglnargarggln 

sertyrphe<jln***thrhisthrglnglnaspproalaleuprqthrlysgluclylys 

CCTCTTATTTCCAGTAGACCCATACCCAACAGGATCCGGCTCTGCCAACCAAAGAAGGCA 

• 8300 • • * 

LYSGLYASPGLYGLYGLYSERGLYGLYASNSERSERTRPPR0TRP0LN1LEGLUTYR1LE 

AAAAACCACAC6GTGGAGGC ACCGGTGGCAAC AGCTCCTCGCCTTGGCAGATAGAATATA 


•( f iz . 1B-9U1 te 6> 
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Se«l>H« PHO»SPI>l>OP«OTHRASPTHRP(lOLEUASPLEU*L»H.tCLNOtNtSUCUi/iS)i 
HISPMELEUH.EARG5LNLF.UILEARCLEULEUTHRTRPLEUPHE5ERASNCY5ARCTHR 
TTCATTTCCTCATCCGCCAACTCATACGCCTCTTGACTTCGCTATTCAGCAACrCCAGAA 

♦ • I * * * 

LEUAI.A 1LEGIU5ER ILEPROASPPRGPROTHRASN I LEPRQCLUAL ALEUCYSASPLfU 
LEULEUS£RARGALATYRCUNIl£L£UCLNPR0ILEPH£GLNARGtEU5£RALATHRTYR 
CCTTCCTATCGAGAGCATACCACATCCTCCAACCAATATTCCAGAGGCTCTCTGCGACCr 

* * • 8500 • * 

F rtETGLYGlYAU 

ARCARCIIEARCARCSERPROGLNAU « ART2 (fin) 
GLYGLUPH€CLYCi.UVALUEUARGLEUCi.UtEUTHRTYRLEUGLNTYRCLYTRPSERTYR 
ACCGAG AATTCGGAGAAGTCCTCAGGCTTCAACTGACCTACCTACA ATATGGGTGCAGCT 

JL£S£RLYSLY$AftGSERLY5PROPROGLUJL£CY5A5PARGASPS£RCYSCLYARGVAL 

PHeCLNGLUALAVAUGLNALAALAARGASPLEUARCGLNARGLEULEUARGALAARGGLY 

ATTTCCAAGAAGCGGTCCAAGCCCCCAGAGATCTGCGACAGAGACTCTTGCGGGCGCGTG 

• 8600 • * * * 
CLYARGASNTYRCLYARGLEUPHeLYSGLYYAULUA$PCLYSER$ERGlN$ERlSUCir 

GLOtYStEUTRPGLUALAtEUGLNARCGUYGLYARGTRPILELEUALA ILEPROARGARG 
GGGAGAAATTATGGGAGGCTCTTCAAACGGGTCGAAGATGGATCCTCCCAATCCCTAGGA 

• • 8700 

GLYLEUASPLY5CLYt£USER$ERt,E05£RC YSGLOGLYGLNtYSTYRASNGLNGLYGLU 

UEARGCLNGLYLEUGUU.EUTHRLEULEU 0 

ggattagacaaggccttgagctcactctcttgtgacgcccaaaaatacaatcacccagaa 

• • * I / t * 

TVRHETASNTHRPR0TRPARGASHPR0AUGLUGI.UARGLYSLYSL6UPR0TYRARGLYS 

tacatgaatactccatggagaaacccagctcaagagaggaaaaaattaccatacagaaaa 

• i * 8800 • • 

CtNASNILEASPASPItEASPCLUGLUASPASPASPLEUVALGLYtLEPROVALGLUALA 

CAAAATATAGATGATATACATGAGCAACATGATCACTTGGTAGGGATACCAGTTGAGCCC 

• • • • • 4 

ARGYALPROLEUARGTHRflETSERTYRLYStEUAUaEASPrtETSERHISPHElLEjLYS 

agagttcccctaagaacaatgagttacaaattcgcaatagatatgtctcattttataaaa 

• 8900 • t • 1 1 # 

GLUtYSGLYGLYLEUGCUCLYIiETYRTYRSERALAARGARCHI SARGILELEUASPILE 
GAAAAGGGGGGACTGGAAGGGATTTATTACAGTGCAAGAAGACATAGAATCTTAGACATA 

• • • • * 9000 

TY RLEUGLULYSGLUGtUGLYILE ILEPROASPTRPGLNILEHlSSERGLYPROGtYItE 
TACTTAGAAAACGAAGAAGGCATCATACCAGATTGGCAGATACACTCCGGACCAGGAATT 

f 4 * • « * 

ARGTYRLEULYSHETPHE GLYTRPCEUTRPLYSLEUILEPR0VALASNVALSERA5PGIU 
ACATACCTAAAGATGTTTGGCTGGCTATCGAAATTAATCCCTGTAAATGtATCAGATGAC 

• • • 9100 

ALAGLNGUJASPGUJGlUHl 57 YRLEUYAIHI SPROALAGLNTHRSERGINTRPASPASP 
GCACAGGAGGATGAGGAGCATTATTTAGTGCACCCAGCTCAAACTTCCCAGTGGGATGAC 

i 

PROTRPGLYGLUVALLEUALATRPLYSPHEASPPROTHRUEUALATYRTHRTYRGLUAtA 

CCTTGGGGAGAGCTTCTACCATCGAAGTTTGAKCAACTCTAGCCTACACTTATGACGCA 

. 9200 • • t . 

TYRILEARGTYRPROGtUGUJPHEGi.YSERLYS$£RGLYt£USERGLULYSGLUVAtLYS 

TATAT7AGATACCCAGAAGAGTTTGGAAGCAAG7CAGGCCTGTCAGAGAAAGAGGTTAAA 

• . . . . 9300 

ARGARGUEUAtAALAARGGLYL£ULEUGLUMETALAA$PARGLYSGLUTHRSER 
AGAAGGCTAGCCGCAAGAGGCCTTCTTGAAATGGCTGACAGGAAGGAAACTAGCTGAGAC 

• I 4 * « « 

accaggcactttccacaaccgcatctcatggcgacctactggcgaggagcccgttcgcaa 

i • « 9400 i • 

cacccactttcttgatgtataaatatcactccatttcgctctctattcagtcgctctgcg 

gacacgctgccacattgagccctccgagcttctctccagcactagcacgtacagcctggg 

« 9500 • 4 • • 

tgttccctgctagactctcaccaccacttggcccctcctggccagagtggctccaccctt 

a a • • « 9600. 
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FIG. 1C 

sequence LTR 
CIVET 
versus 
HIV. 2 ROD 


X 8960 8970 8980 8990 9000 9010 

TGCAAGCGATTT ATT ACAGTGCA ACAACACATACAATCTTACACATATACTTAGAAAAGG 

• #«*«#«*«#'*• *««# + « + # «#•#•««««•##«•*« 
**#«»•*«•* « «««••««•«** •«««••« • 

TGCAAGGGATGTTTTACAGTGAAAGAAGACATAAAATCTTAAATATATACTTAGAAAAGG 
X 8950 8960 8970 8980 8^90 


9020 9030 9040 9050 9060 

AAGAAGGCATC ATACC AGATTGGCAGATACACTCCGGA CCAGGAATTAGATACCT AA 




« * 


««•#«* 
«•••« + 


9 • • 


AAGAAGGGATAATTGCAGATTGGCAGAACTACACTCATGGGCCAGGAGTAAGATACCCAA 

9010 9020 9030 9040 9050 


9080 9090 9100 9110 9120 

AGATGTTTGGCTGGCTATGGAAATTAATCCCTGt AAATGTATCAGATGAGGCACAGGAGG 


t : ::::: ::::::::::: :: : :: ::: ssss 

W * W VvVVVVVVVW -W * W “ m V V VVv w ^ W W “ W w w W w 


• * * 
• • * 


TGTTCTTTGGGTGGCT ATGGAAGCT AGTACC AGTAGATCTCCC ACAAGAAGGGGAGGACA 

9070 9080 9090 9100 9110 


» t 


9140 * 9150 9160 9170 9180 

ATGAGGAGC ATTATTTAGTGCACCCAGCTCAAACTTCCC AGTGGCATGACCCTTGGCGAG 

# f # • • 4 • i * « f « « « « « 4 « 4 9 * « « « # 9 # « ft9«99«99 « « « 

CTGAGACTC ACTGCTT AGTACATCC AGCACAAACAAGCA AGTTTGATGACCCGCATGGGG 

9130 9140 9150 • 9160 9170 


9200 9210 9220 9230 9240 

AGGTTCT AGCATGGAAGTTTGATCC AACTCT ACCCTACACTTATGAGGCATATATT AG AT 

• • • • • 9 * « 9 t«9«9999f« 9 * • • 9 • • 9 9 9 9 9 9 9 9 9 9 • 9 • * 9 

« 4 § • * « •*« 9999999999 9 9 9 9 9 9 9 9 9 9 9 9 9 9 9 • 9 9 9 9 9 9 

AGACACTAGTCTGCGAGTTTGATCCCTTGCTCGCTTATAGTTACG AGGCTTTTATTCGGT 

9190 ‘ 9200 9210 9220 9230 


9260 9270 9280 9290 9300 

ACCCAGAAGAGTTTGGAAGCAAGTCAGGCCTGTCAGAGAAAGAGGTT AAAAGAAGGCT AG 

• +4 « 9 9 9 9 9.99999S999999 9 * 9 9 9 • ■ • • 9 4 9 4 9 • 9 

9 9 9 9 9 9 9 4 9 * * * 9 • «94i*9**»499* 9 9 « 9 9 9 9 9 9 9 i « i 9 9 4 

ACCCAGAGGAATTTGGGCACAAGTCAGGCCTGCC AGAGGAAGAGTGGAAGGCGAGACTGA 

9250 9260 9270 9280 9290 


9320 9330 9340 9350 

CCGCAAGAGGCCTTCTTGAAATGGCT-GACAGGAAGGAAACT 

«44*«4«9 • 9 9 * 44949944 • 

«fl9444«9 # 4 4 *4494444 4 

AAGCAAGAGGAATACCATTTAGTTAAAGACACGAACAGCTATACTTGGTCAGGGCAGGAA 

9310 9320 9330 9340 9350 
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9360 9370 9380 9390 

AGCTGAGACAGCAGCGACTTTCCACA3CGGCATGTCATC— GCGA 


**9«9«9#**4*44 9 4 4 • 


• • I « 
« • • * 


ctaactaacacaaacagctgacactgcagcgactttccacaagcccctctaaccaacgga 

9370 9380 9390 9400 9410 

9400 9410 9420 9430 9440 9450 

ggtactgcggaggagccgcttcggaacacccactttcttgatgtataaatatcactgcat 


• • 


#«#*«••*# f ♦ * tf 4 • « « 4 4 4 4 

• #44««44# 4 4* « 4 « 4 « 4 441 


4 ««*** 4 *»»» f • 

494 A 444144 # * « 


' , V 


GGG ACATGGGAGGAGCTGGTGGGGAACGCCCTCATATTCTCTGTATAAATATACCCGCT a 

9430 9440 9450 9460 9470 

9460 XX 10 20 30 40 

TTCGCTCTGTA— TTCTGGAAGGGATTTATTACACTGCAACAACACATACAATCTTAGAC 

: 4«4#44444t*«4 • «*9*949« 4*t«t4«t4t4 * 

• ««44f««4«14« t 44il«44t*«4 • • * • 9 • * 9* 

GCTTGCATTGTACTTCTGGAAGGCATGTTT.TACAGTGAAAGAAGACATAAAATCTTAAAT 
. 9490 XX 10 20 30 40 


- * 

4 - V *' 


• 50 60 70 80 90 

atatacttagaaaaggaagaaggcatcataccagattggcagatacactccgga- — CCA 


4 4 * 9 9 4 


4 9 4 




4 • 4 « 

4 4.44 




4 4*4 
4 9 4 


* 9 * 


ATATACTTAGAAAAGGAAGAAGGGATAATTGCAGATTGGCAGAACTACAC7CATGGGCCA 
50 \ 60 70 80 90 100 


110 120 130 140 }50 

GGAATTAGATACCT AAAGATGTTTGGCTGGCTATGG AAATTAATCCCTGTAAATGTATCA 




* • 




GGAGTAAGATACCCAATGTTCTTTGGGTGGCTATGGAAGCTAGTACCAGTAGATGTCCCA 
110 120 130 140 150 160 


170 180 190 200 210 

GATGAGGCACAGGAGGATGAGGAGC ATTATTTAGTGCACCCAGCTCAAACTTCCCAGTGG 


CAAGAAGGGGAGGACACTGACACTCACTGCTTAGTACATCCAGCACAAACAAGCAAGTTT 
170 180 190 200 210 220 


230 240 250 260 270 

GATGACCCTTGGGGAGAGGTTCT AGCATCCAAGTTTGATCCAACTCT AGCCTACACTTAT 


• 4 


• • 4 « 
4*44 


• * 9 


s:::: ::::: 


« * 


9 9 


9 9 


GATGACCCGCATGGGGAGACACTAGTCTGCGAGTTTGATCCCTTGCTGGCTTATAGTTAC 
230 240 250 260 270 280 


290 300 310 

GAGGCATATATTAGATACCCAGAAGAGTTTGGAAGCA 

5 94*9 4 4 4 9 4 * 

• ••« 4 4 9 4 9 « 

GAGGCTTTT.ATTCGG 

290 
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( HIV-2. P 
( versus 
< HIV-1.? 


to- 


tO- 




Jr 




env4 


40 


KIV2 

HI VI 


'-tii:: q li : a illa-saclv ic-orvrv? y_,c _y ? r u n 'j & 1 1 

* * *********** 

* 

HRVUEKYQHL tiRWCVUWGTK LLGILttICSA TEilLWVTVYY GV? VWKEATT 


60 * 70 SO env5 90 100 

K I V2-— PLFCAT f RHR OT !/G TIQCLPD HDP YOSITL-HVT EAFPAWHN TV 

**** ** * * * * ** * **■* * * * * 

HI VI TLFCASDAKA YDTEVHH VWA THACVPTDPU ?Q£VVLVIiVT ENFHMVKUDM 


10 110 ]f 120 « n v6 no 140 150 

EIV2 . TEQAIEDVVH LF ETSIKPCV KLTPLC VAMK 1 O SSTESSTCN HTTSKSTSTT 

** ** * * * *** ******* * * * * * * 

HIV 1 VEQHHEDIIS LWDQSLXPCV KLIPLCVSLK CTDL Gti ATNTHSSNTH 



u 


160 lie .. . ,.130 190 200 

EIV2--- r — --TTTPTDQE QEISEDTPCA RADKCSGLGE EETIHCQFNM TCLERPKKKQ 

15 * ,***■ 

HIVl S SSCEMHKEK GEIK— — t HCSFKIS TSIRGKVQKE YAFFYKLDII 


i. 


20 


HIV2 


HIVl 


210 220 230 env 7 240 | 250 

X— KET-UYS KVVCETNNST HOTOCYH HHC I1TSVITSSCD KHVW1MI8FB 
* * * * **“**** * * * * 

P IDNDTTSYT TSC 1JTSV1TQAC? KVSFEPIPIH 


260 env8 270 280 290 300 

HIV2 YCAFPGVALL RC-NPT -KYS GFAPNCSKVV ASTCTRMHET QTSTVF-GFH 

**** ******* * ** ’** ** * 

HI V1 YCAPACFAIL KCKWKTFJJGT GP— CTHVS IVQCTHGIRP VVSTQLLL-H 

i 



KIV2 

HIVl 


**•<*••**» 

310 320 330 340 350 

GTRAE W RTYIYVHCRB K-Rril-SUl KYYKLSLKCK RPCHKTVKqi 

* ** * * * «** ** * ** * * * * 

GSLAEEEVVI RSAWFT-~D KAKTIXVqiN QSVE--IHCT RPKNNTRKSI 


360 370 env * 380 390 400 

30 H I V 2 MU1S— GHVF HSSY0P1 SKR PR0AWCV7FKG -EWCD AMQSV KETtAKHPRY 

* * * *** * V* * * 

HIVl RIQRGPGRAF VTIGKIGH — MRQAHCJilSR AKWllAT L KQlASKLRSQ 
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«> 


* 


10 


15 


20 


25 


uo 


* 


420 


envlO 


430 


440 


450 


HIV2 

- RGTNDTRNIS 

1 FAAPCKGSDP EVAYHVTNCfi 

l GEFLYCKKTU 

FLJN-WI 


* * * 

* nr lint 

* ** 

*** *** * 

* * 

hi?: 

FGmJKT— II 

FKQSS-CCDP 

EIVTHSFNCG 

: GEFFYCKS7Q 

LFHSTVFNST 


460 

\{ 470 

envll 460 

490 

500 

H 1 72 

— £J] 

XTHRNYAPCH 

IKOIlNTVmK 

VCRHVYLPF* 

SGELSCNSTV 



1 ** 

*** -** * 

** * it* 

* * 

HI VI 

WSTECSNNTE 

GSDTITLPCR 

IXQFINMVQE 

VGXAMYAPPI 

SCQIKCSSNI 


510 

520 

530 

540 

> 

550 

HIV2 

TSIIAHIDHQ 

HNKQTHITFS 

AEVAELYRL- 

— ELGDYKLV 

EITPICFAPT 


* * 

*■** ★ 


** ** * 

★ * * ir*H 

H I VI 

V * 

IGLLLTRDGC 

^ * 

BNHHCSEIFR 

PGCGDMRDHW 

* m 

, h 

KSELYKYXVV 

K1EPLCVAPT 

t 

\ a 

env3 560 

570 

580 

‘ 590 

600 

HI72 

KEKRYSS AHG 

RHTRCVFVLC 

— FLGFLATA 

GSAMGAAS— * 

LTVSAQSRTL 


* ** 

* 4 * * 

***** * 

** *** * 

*** * # * 

HI Vl 

KAKRR — VVQ. REKRAVGI-G 

4 

ALFLGFLGAA 

GSTHGARSMT 

LTVQA--RQL 


610 

620 

630 

| 640 

envl ' 6 50 

HI72 

LAGIVQQQQQ 

LLDVVKRQQE 

LLRLTVWGTK 

NLOARVTAIE 

KYLODOARLH 


* ****** 

** ** 

tt ***** * 

**** * * 

** ** * 

HIV1 

LSGIVQQQtJH 

LLRAIEAQQH 

LLQLTVUGXK 

QLQARILAVE 

RYLKDQQLLG 


.660 

■K 

670 

680 

6 90 

700 

3 IV2 

STfGCAFROVC 

HTTVPW— - 

VNDSLAPDWD 

NHTVQEWEKQ 

VRY1SANISK 


*** * 

* *t* 

* * * 

**** ** 

* 

aivx 

IVCCSGKLIC 

TTAVPSJUSt. 

SKXSLSQIUH 

SHTWKEKDRE 

IWHYTSLIIiS 


^ 710 

env2. 720 

730 

740 

750 

B1V2 

SLEQAOIOOE KJJMYELOKLN 

SVDITGKVJFD 

ETSWVXYIQY 

GVLIIVAVIA 


it it *** 

** ** * 


* * ** 

* 

HI Vi 

LIEESQNQQE ; 

KNEQEILELD : 

KVASEWNWFH 

ITHVLWYIKI 1 

F IMI VGGLVG 


(fig. 2 - suite 1) 



WO 88/05440 


PCT/FR88/00025 


22/35 


* 

* 




760 770 780 790 800 

HIY2 LRIVIYWQM LSRLRKGYRP V-FS SPPGT1 QQIHIBKDRG QPAHEETEED 

**** * ****** ** * ** 

HI V 1 LRIVFAVLSI VNRVRQGYS? LSFQT ULPTPRG PDRPEGIEEE 


t 


■ 1 ,t 

5 

310 

820 

830 

» 

840 

850 

HI72 

GGSNGCDRYW 

PWPIAYIRFL 

IRQLIRLLT- 

*: — — LYSIC 

ROLLSRSFLT 

* - *' * % ' 


l 

* * * 


**** 

HI VI— 

1 4 * 

* * 4 

CGERDRORSl 

RLVMCStA-L 

IWDDLRSLCL 

FSYHRL 

RDLLLI VTRI 





HIV2- 


HI71 


« 

860 870 880 890 * 900 

LQLIYQNLRD VLRLRTA— F LQYGCEVIQE AFQ -AAA RATRETL— <■* 

* * * * *** * * * * 

VELLG--RRG WEALKYWVKL LQYWSQE1KN SAVSLLNATA IAVAECTDRV 


* 


910 920 930 938 

HIV2 — -AGACRG LVRVIERIGR CILAVPRRIR QCAEIAU. 

** ***** ** * ** 

HI71 IEVVQCACRA -IRHIPRRIR QGLERILL 


3 - 




(fig. 2 


suite 2) 



WO 88/05440 


PCT/FR88/00025 


23/35 
( ENV-mac 
FIG .3 ( versus 
( SMV-aOD 


10 


20 


30 


AO 


50 


HGCLGNOLLI AIC—SKCLWI ICI QYVTVFYG VPAWRNATIPCFCATKNROTWGTTGCL 




* f 4 


• 4*4 + 44 * 44 * • 

• * 4**4 44*44 * 


aaaaAaAA* & r- ^ a a » 


m NQLLI AiLLASACLVY-CTQYVTVFYGVPTWKNATIPLFCATRNRDTWGTI QCL 

10 20 30 40 50 

60 70 80 90 100 110 

PONOQ YSELALNVTE5FQAWENTVTEQAIEDVW0LFETSIKPCVKLSPLCI TfIRCNKSET 


• 4 

♦ 4 


• 4 


* * 
4 4 


• • 


4 • • « 
« 4 • « 


• 4 

• ♦ 


4 4*4 
4 4*4 


4*4 

4*4 


4*44 

4*44 


• * * 
4 4 4 


• 44 


PDNDDYOEI TLNVTEAFDA WNNT VTEQAIEDVWHLFETSIKPC VKtTPLCVAMKCSSTES 
60 70 80 90 100 110 

120 130 1 AO 150 160 170 

OKWGLTKSSTTTASTTTTTTAKSVETROIVNETS PCVVHDNCTGLEOEPKISCKFNH 


4 * 


4 4 4 * 
• 4 * • 


• 4 


4 4 


4 * 


*4 4 * 

4 4 4 * 


*44 


STGNNTTSKST — STTTTTP T-DQEOEISEOTPCARA ONCSGLGEEET INCOFNH 

120 130 190 150 160 

r ' 1 - • . ■ * 

180 190 200 210 220 .. 230 

TGLKRDKKKEYNETWYSADLVCEQGNSTGNESRCYnNHCNTSVIQECCDKDYHDAIRCRY 


• • • 




4 4*4 
* * * * 


* * * 


* * * 

• * * 




* * 4 * 4 *** 4 * *4 

* # 4 * * 4 * 4 ** * # 


TGLEROKKKQYNETWYSKOVVCETNNST-NQTQCYHNHCNTSVITESCOKHYHDAIRFRY 
170 180 190 200 210 220 

290 250 260 270 280 290 

CAPPGYALLRCN0TNYSGFf1PNCSKVVVS.$CTRMMET0TSTHFRFNCTRAENRTYlYHHG 


4 ** 444 * 444*44 44*444 *44 

% 4 # 444 ** 444444444*4 444 


4 •* 444 ** 4 ***** ••••** 4 * 4*#***44 

4 4444444444 * 4 * 44 4444444444 4*44 


CAPPGYALLRCNDTNYSGFAPNCSKVVASTCTRHHETQTSTWFGFNGTRAENRTYIYWHG 
230 290 250 260 270 280 

300 310 320 330 390 350 

RONRTI I SLNKHYNLTMKCRRPGNKTVLPVTINSALVFHS — OP VNERPKQAWCRFGGNH 


* * * 
*44 


* * 4 
4*4 


**• 
4 4 4 


* 4 4 


* 4 * 
4 4 * 


4*4 4 
4 4 * 


* 4 
4 4 


4 4 4 


* * * * 
4 4 4 * 


RONRTI I SLNKYYNISLHCKRPGNKTVKQIM.MSGHVFH5HYQPINKRPRQAWCMFKGKW 
290 300 310 320 330 39 0 


360 370 380 390 900 

KEAIKEVKOTIVKHPRYTGTNNTOKINLTAPRGG-OP6VTFNHTNCRGEFLYCKHNWFLN 


* 4 


s : 


4*44 
• 444 


: : 


4 * 


: : s s it 




4*44 

*444 


KDANOEVKETLAKHPRYRGTNDTRNISFAAPGKGSDPEVAYMWTNCRGEFLYCNMTWFLN 
350 360 370 380 390 900 


FIG. 3 



WO 88/05440 


PCT/FR88/00025 


24/35 


420 4 30 440 450 460 

WVEDRGLTTQKPKERHKRNYVPCHIRQI IN TWHK VGKNVYLPPREGDl, TCN5TVTSLIAN 


* # 

* « 


« • * « ♦ # * ♦ ••**•*••*2 

« * • « * • < % •••##•**»• 




• * * * * 


« t t 
• * • 


HIE M kt-h-rnyapchikqunthhkvcrnvylpprecelscnstvts l IAN 

410 420 430 440 450 


* 


400 490 500 510 520 

I NWTDGNQTS I TMSAEVAELYRLELGOYKLVEITPI CLAPTNVKRYTTG-GTS RNKRGVF 


• * 


« # 
• 4 


« #*# + *«4»4*4*#*»*«#4*4**4 9 # ♦ #«# * 

# *•#*»* + *«»*«*•# ••«*♦*««* • • % • « « 9 


9 9 9* 

« 9 « • 


IOHONNNOTNI TFSAE VAELYRLELGD YKL VE I TP I GFAPTKEKRYS5AHG — RHTRGVF 
460 470 460 490 500 510 


540 550 560 570 580 

VLGFLGFLATAGSAMGAASCTVTAQSRTLLAGI VOQQQQCLOVVKRQQELLRLTVHGTKN 




* 4 


VVVVVVV “ ' ” * ^ T * * ' “ w ” 


VLGFUGFLATAGSAflCAASUTVS AOSRTULAGI VOQOOQLLOVVKROQ6LLRLTVHGTKN 

520 530 540 550 560 570 


600 610 620 630 640 

LQTRVSAIEKYtKOOAQlNAHGC AF ROVCHTTVPHP NASLTP0HNNETM0EW6RKV0FLE 


a « + rn •««««• * * 9 « 4 4 44 444 4 ***44# 4 

44 44 444 4 44 4 44 #4 444444*4*444444 4 44 444 4 44*444 4 


* 4 
4 4 


LOARVTAIEKYLOOOARLNSWGCAFROVCHTTVPHYNOSLAPDMONMTWOEHEKOVRYLE 

580 . 590 600. 610 620 630 

I. ^ T * * 

‘ S ► ' ' 

660 670 . 600 690 700 

ANITALLEEAOIOQEkNHYELOKLNSHbVFGNWFOLTSHIKYIOYGIYI IVGV ILLRIVI 


4 4 4 
4 4 4 


4 4 








anisksleoaoiqqeknhyeloklnswdifgnwfoltswvkyiqygvliivavialrivi 
640 650 660 670 680 690 


720 730 740 750 760 

yivqm.arlrqgyrpvf$$ppsyfq«thtoqdpalptkegkkgogggsgcn$swphoiey 


* 

4 4 4 4 44 4' 44444*44*4 4 # 5 


* * 4 

• 4 4 


4*4 
4 4 4 


* m 

* • 


4*4 

4*4 



yvvqmlsrlrkgyrpvfssppgyiooihihkdrgopaneeteedggsnggoryhpwpiay 

700 710 720 730 750 750 


780 790 800 810 820 

IHFUR01IRU.TWLFSNCRTUSRAYQILQPIFQRLSATYGEFGEVLRLELTYL0YGVIS 


4 4 
4 4 


44444444*44 4 

4*44444444* 4 


4 4 
4 4 


4 4* 
4 4 4 


4 4 


: 


4 4* 
*44 


4 # 
4 4 


♦ 

4 


IHFL1R0LIRLLTRLYS1CR0LLSRSFLTL0LIY0NLR0W LRLRTAFLQYGCE ■ 

760 770 780 790 800 


T4 


850 850 860 870 880 

YF0EAVQAA-RDLR0RU.RA-RGEKLHEAL0RGGRWIU1PRRIRQGIELTU. 


4 4 4 
* * * 


4 4 4 
4 4 4 


4 4 

4 . 4 


* 4 
4 4 


4 4 


4 4 4 

4 4 4 


4 # 
4 4 


4 


4 4 4 
4 4 4 


4 4 
4 * 


WIQ 8 AFQAAARATRETLAGACRG— IWRVLERIGRGILAVPRR JRQGAEIALL 
810 820 830 850 850 


l 


(fig, 3-suite 1) 



WO 88/05440 


PCT/FR88/00G25 


25/35 

( GAG-mac 
FIG. 4 (versus 

(GAG-ROD 


10 20 30 40 50 

VQHKKE IAVFYPGRDNKIEWEMGARNSVLSGKKADELEKIRLRPGGKKKYMLKHVYWAAN 

*4444444 44*44444 * 4 * 44*44444 • * 4 « * • « • 
*44*4*44 ##♦***•• *»**##4««*^ * # # « t * ♦ ♦ 

hgarnsvlrgkkaoelerirlrpgckkkyrlkhivwaan 

10 20 30 


4 






70 80 90 100 110 

ELDRFGLAESLLENKEGCQKILSVLAPLVPTGSENLKSLYNTVCVIWCIHAEEKVKHTEE 




• 4 « « • 


: 






kldrfglaeslleskegcqkiltvldpmyptgsehlkslfntvcvimcihaeekvkdteg 


40 

50 

60 

70 

80 

90 


130 

140 

150 

160 

170 


. akoivqrhlvmetgtaetmpktsrptapfsgrggnypvqqigcnythlplsprtlnawvk 

4 


AKO IVRRHLVAETGTAEKMPSTSRPTAPSSEKGGNYP YQHVGGNYTHIPLSPRTLNAWYK 
100 110 120 130 140 150 


190 200 210 220 2*30 

UEEKKFGAEV VSGFQALSEGCL PYOI NQM.NCVGDHQAAMQ1 IRDI INEE AADHDLCHP 


* 4444 * 4*44 


4 4 4 


4 4 
4 4 



: : : 2 : : : : 2 : : : 2 


4 4 


4 4 4 4 
* 4*9 


4 4 4 
4 9 4 


LVEEKKFCAEVVPGFQALSEGCTPYOI NOHLNCVGDHQAAMO J IRE1 INEE AAEWDVCHP 


160 

170 

180 

190 

200 

210 


250 

260 

270 

280 

290 


QOAPOO— GQLREPSGSOIAGTTSTVEEQIQHNYROQNPIP VGNIYRRWIQL.GLQKCVRMY 

4 4 4 4 * « 4 4*4444444 4444 44444 4 *44 444*4444444 4 * 44444*4 


IPGPLPAGQLREPRGSOIAGTTSTVEEQI OWMFRPONPVPVGNIYRRW 101 GLQKCVRNY 


220 

230 

240 

250 

260 

270 

300 

310 

320 

330 

390 

350 


NPTNILDVKQGPKEPFOSYVORFYKSLRAEOTOPAVKNWMTOTU.IONAMPOCKLVLKGL 



4 

4 


• 4 


4 4 


: 




4*4 


4 


4 

4 


4 4 


4 4 4 
4*4 


4**4 
9 4 4 4 


NPTNILDIKQGPKEPFOSYVORFYKSLRAEOTDPAVKNHflTOTLLVONANPDCKLVLKGL 


280 

290 

300 

310 

320 

330 

360 

370 

380 

390 

400 

410 


GTNPTLEEMLTACQGVGGPGQKARLHAEALKEALAP APIPFAAAQQKGPRKP IKCWNCGK 


GMNPTLEEMLTACOGVGGPGQKARt.flAEALKEVIGPAPlPFAAAQQ RKAFKCUNCGK 

390 350 360 370 ‘ 380 390 


FIG. 4 



WO 88/05440 


PCT/FR88/00025 


26/35 


e 


4 20 430 440 450 460 570 

ECHSARQCRAPRROGCWKCGKMOHVNAKCPNROACFtGLGPWGKKPRNFPMAQVHQGlTP 


• * * 
• • « 




• **%«* •««*+* 




EGHSARQCR APRROGCWKCCKPGHI MTNCPDRGAGFLGLGPWCKKPRNFPVAQVPQGLTP 
400 410 420 430 440 450 


480 490 500 510 

TAPPEEP AVDLLKNYMHLGKOQR £S RGKPYK EYTEDLLHL 


« « i 4 
« « • * 




4 • 


* ♦ 


• • * • « i • 

# 4 « • # • 


« * 


NS 


m m 


# « « # * * 


TAPPVDP AVbLLEKYNQQGKRQREQRERPYKEVTEDLLHLEQCETPYREPPTEDLLHLNS 
460 470 480 . 490 500 510 


<4 


* . 


> 




J 


i 



\ 


r 


& 


(fig. 4 - suite 1) 


¥ 


9 



WO 88/05440 


PCT/FR88/00025 


27/35 

( POL-mac 
F £ G « 5 ( versus 

( POl-ROD 


10 20 30 40 50 

VLELWEGRTLCKAMOSPKKT GfILEHWKNGPCYGQfIPKGTGGFFRPWPLGKEAPQFPHGSS 


ft ft 
* * 


* • • 
• ft • 


• « • 
* • «’* • 


• * * 
# • « 


T GREF RTGPLGKEAPOL PROPS 

10 20 


70 80 90 100 

ASGADANCSPRRTSCGSAKELHALGOAAERKQREALQGGDRGF 


ft « • • 

• • • ft 


« « * 

• I • 


* * 
* ft 


« * 
• * 


« • ■ 4 « 

ft ft ft ft ft 


sagaotnstpsgsssgstceiyaarekteraeretiqcsdrgitapraggdtiogatnrc 

30 40 50 60 70 80 


110 . 120 130 140 150 160 

-AAPQp StWRRPVVTAHlEGQPVEYLLOTGAODSl.VTGlELGPHYTPKIVGGl GGFINTK 

’ * * 

ftftftftftftftft •«»««• ftft«ftftftftftftftftftft«ftft 4 ftftft ft ft ft • • « ftftftftftftftftftftftftftft 
ftftftftftftftft # « « « # ft ft « « « • « ft vftftftftftftftftftft* ft ft ft ft ft ft ftftftftftftftftftftftftftft 

LAAPQFSLWKRPVYTAYIEGQPVEVLLDTGAODSIVAGIELGNNYSPKIVGGIGGFINTK 
90 100 110 120 130 140 


170 180 190 200 210 220 

EYKNVEIEYLGKRIKGTinTGDTPlNIFGRNLLTALGHSLNLPl AKVEPVKSPLKPGKOG 

ftftftftftftftftftft ft ft ft ft ft ft ft ft ftft ft ft ft ft ft ft ft* •«*«****• ft ft • ft ft ft ftftftftftfft 

ftftftftftftftftftft « ftftftftftft«ft«ftftftftftft ftftftftftftftftift# ft ft • « # « ft ft • ft ft 6 • 

EYKNVEIEVLNKKVRATIHTGOTPINIFGRNlLTALGnSLNLPVAKVEPlKIHLKPGKDG 
ISO 160 170 180 190 200 


230 240 250" 260 270 280 

PKLKOHPLSKEKIVAt.REICEKnEK0GOLE.EAPPTNPYNTPTFAIKKK0KNKNRHI.10FR 

♦ • * ft** • • * * •• •••#•#«« ft«***«*#9 + *# + + *****f*f*9£££fft£2S£ 

ft ft ft ft « « ft ft • ft « # t *ft«ftftftftftftftft 5 ft#ftftftftft#ftftftft ftftftftftftftftftft 

PKLROHPLTKEKIEALKEICEKHEKEGQLEEAPPTNPYNTPTFAIKKKOKNKHRMLIOf R 
210 220 230 240 250 260 

290 300 310 320 330 340 

ELNRVTQOFTEVOLG1PHPAGLAKRKR1TVLOIGOAYFSIPLOEEFRQYTAFTLPSYNNA 

• ft # ft ft ft ft ft ft » •##«cft«««4*f ft « ft ft ft « ft#*#***** ft » f !!*••!!!!!!* 

* • ft ftft«ft*ft« •*****•«*#•« *%«*•« ft******** « ft* ftft«ft«ftft#ftftftft 

ELNKVTOOFTEIOLCIPHPACLAKKRRITVLDVGOAYFSXPLHEOFRPYTAFTLPSVNNA 
270 280 290 300 310 320 


3S0 360 370 380 390 400 

EPGKRYIYKVLPQGHKGSPAtFOYTHRHVLEPFRKANPOVTLVQYHOOILIASDRTOLEH 

Hi itttttitt «: 

EPGKRYIYKVLPOGHKGSPAlFOHTHRQVLEPFRKANKBVniOYHOOILIASORTOLEH 
330 340 350 360 370 380 



25/35 


410 420 *30 440 450 460 

0RVVLQLK£Lt.N5ICF55PeEKf OKOPPf OWrtGYElMPTKWKLQKJE LPQRETkTYNOIQ 

• 4 » • « i | f f « « 4** * • * « * 4 I * 

ft • • « t 4 * 4 4 « « t 4 « « 4 * 

0RVVLQLK6LLNCI.CFSTP0EKF GKOPP YHKHGYELWPTKWKLQK I OLPOKE l RTVNDIQ 


390 

400 

410 

420 

430 

440 

470 

480 

490 

500 

510 

520 


KLVGVLNWAAQIYPGIKTKHLCftURCKMTLTEEVaHTettAEAEYEENKIlLSGEGEGCY 


4444«4«9*t4 4#4t44**«4«444«*4*4a4|4*4«4 >444 

I I t « I < t f t 4 t 4««44«44«4#«l4444*4l4t494*« 4 « « * 




4i«944»« 
*444 4 4 « « 


KLVCVLWWAAOL YPCIKTKHL CRLIRGKMTlTEEVQWTELAEAELEENR ItLSQEQECHY 


450 

460 

470 

480 

490 

500 

530 

540 

550 

560 

570 

560 


YQESKPLEATVIKSQDNQWSYK I HQEDK JIKYGKFAK IKNTHTNGVRLLAHVI QK ICKEA 


yqeekeleatvqkdqenqktyki hqeekilkvgkyakvknthtngirllaqyvok ickea 


510 

520 

530 

540 

550 

560 

590 

600 

610 

620 

630 

640 


I VI WGCVPKFHLPVEKOYWEGWWTDYWQYTh JPEWOF ISTPPLYRCYFNLVKDPIEGEET 


LVlWGfUPKFHLPVeREIWEQHWONYWQVT^IPOWDFVSTPPLVRLAFNLVCOPIPGAeT 


570 

580 

590 

600 

610 

M 

620 

650 

660 

670 

680 

f 

690 

70C 


YYV005C5K0SKE0KACY1 TORCKOKVKVLEOTTNOOAEtEAFLMALTOSCPKANII VOS 


* 


• m A 0 

• • 9 • 


• « 


4 4 4 


::::::::: i :: : 




9 * 


• « * # 
» * «• 


FYTOGSCNRGSKEGKACYYTDRCKDKVKKLEOTTNQQAELE AFANAL705GPKVNII YDS 


630 

640 

650 

660 

670 

680 

710 

720 

- 730 

740 

750 

760 


OYYMGI 1TGCPTESESRLVNQI IEEMIKKTE IYVAHVPAHKG IGGNQEIDHLVSQG1RQV 






4 4 f « 
M 4 « 




tin: 


• « 4 * 
*444 


9 9 9 9 9 9 0 #»#«#»•**** 

• ■ 4 4 4 4 4 4«A4I44444« 


OYVMG IS AS0PT6SESKI VNQI I EEHl KKEAIY YAH VPAHkGlGGNQEYOHLVSOGlRQV 


690 

700 

710 

720 

730 

740 

770 

780 

790 

. 800 

810 

820 


LFLEKlEPAQEEHSRYHSNIKELVFKFGUPRLVAKOZVOTCOKCHOKCEAIHGOVNSOtC 


LFLEKIEPA0EEHEKYHSNVKEC5HKFGJ PKLVAROI VNSCAOCQOKGEAIHGOYNAELG 
750 760 770 760 790 800 


830 340 850 860 870 880 

TWOftDCTHLEGKX VI VAVHVASGFI £AEYIPQ6TGRGTAi.FH.KLA$RWP JTHLHTDNGA 

i : j ss s :: s ts :: s : s : ::: :::::::::::::: ::: 


TWOMOCTHLEGKI nVAYHYASCFtEAEVlPQESGROTALFLLKLASRWPITHLHTDNGA 


810 

820 

630 

840 

850 

860 

890 

900 

910 

920 

930 

940 


NFASQEVKflVAWWAGI EHTFGVP YNPQSOGYVEAKNHHLKNQlDRIREQANSVETlVLttA 

it j j j ::: i : mtiti 

NFTSOEYKMYAHHtGI EOSFGVP YNPOSOGYYEAMN HHLKNOI SRI REQANT1ET XVLftA 
870 880 890 900 910 920 


950 960 970 980 990 

YHCHNFKRRGGIGOMTPAERL INHITT6QEIQFOQ5 KH5KFKNFRVYYR6GR00LHKGPG 

* 

|Ml44f44«t4444 • 4449 f » • 4 » fl*44444f«A« 
MtlAlWlMIfM t 4 4 4 4 4 4 i 4 4 i4444444««44 

IHCMNFKRRCGIGOMTPSERLINHI tteoeiqflqaknsklkdfrvyfregrdqlwkgpg 

930 940 950 960 970 980 


1010 


1020 


1030 


1040 


1050 


ELLHKGEGAVaKVGTOZKVYPRRKAKUKOYGGCKEnOSSSHnEOTGEAREVA 


(fig. 5-suite 1) 



WO 88/05440 


PCT/FR88/00025 


29/35 


!* 




4 ' J ^ >• 4 • 




« • « 


« * 
# • 


* % • * 
# « * « 


I • * • 4 • t 

♦ ♦ * « •* * • 




ELLHKGEGAVLVKVGTOZKI IPRRKAKI ZR0YGGRQEMD5GSHLEG AR£DG£MA 
900 1000 1010 1020 ■ . 1030 


* 


9 


* 


4 


(fig, 5-suite 2) 


*• 



WO 88/05440 


PCT/FR88/00025 


30/35 


( Q .mac 

F IG . 6 ( versus 

( Q* ROD 


10 20 JO 40 50 

MEEEKRW JVVPTHRI PERLERWHSLIKYLKYKTKDLQXACYVJ.PHHKVGWAWWTCSRVIFP 


* • * 
• • % 


+ * * * 4 * * A * 




MEEDKRKI V VPTWRVPGRMEKWH5LVKYLKYKTK0LEKVCYVPHHKVGWAWWTCSRV IFP 

10 20 30 40 50 


70 80 90 100 110 

LQEGSHLEYQGYWNLTPERGWLSTYAVRITWYSKDF WTDVTPEYAOItLHSTYFPCFTAG 

: s::s s s::::: ::::::: 

LKGNSHLEZQAYHNLTPEKGHLSSYSVRITWYTEKFWTDYTPDCADVLIHS TYFPCFTAG 

70 80 00 100 110 


130 140 150 160 170 

EVRRAIRCERLLSCCRFPRAHKHQVPSLQYLALRVVSHYi-RSQCENPTHKQVIRRONRRSL 

::s:: r::::s ::::: s: : s: 

EVRRAlRGEKLLSCCNYPRAHRAOVPSLOFLAtVVVOQNORPQROSTTRKQRRROYRRGL 


130 


140 


150 


160 


170 


180 190 200 210 

RVAKQNSRGOKQRCGKPPTEGANFPGLAKVLGILA 

: : : s : : ::: : ; sstss::«s 

rlakqosrshkorssesptprtyfpcvaevleila 

190 200 210 



WO 88/05440 


PCT/FR88/00025 


* 


31/35 


( R.mac 
FIG. 7 ( versus 
~( R. ROD 


10 20 30 40 SO 

HE ERPPEN6GPaREPWOEHVVEVLKELKE£AU<HFOPRLLTAl.CNHIYNRHGOTLE 

* • 4 4 4 4 4 4 i « * « 4 # 444*4444*4444 4 4 4 • • 

* • * * 4 t • • 4** « * 4 4*44444444444 4 4 4 4 4 «**•*•• 

MAEAPTELPPVDGTPL.REPGDEW1 IEI LREIKEEACKHFOPRLLIALGKYl YTRHGOTLE 

10 20 30 40 50 


60 70 80 00 100 

C ACEL IR ILQRALFIHFRSGCSHSRIGQPGG6NPLSTIPPSRSNL 


f • • 4 4 


# 4 4 4 4 4' 4# 


4 * 4 4 4 4 4 

• 4 4 4 4 4 4 


4 4 4 4 4 


4 4 

4 4 


GAR6LIKVLQRALFTHFRAGCGHSR1GQTRGCNPLS AIPTPRNHQ 

70 80 90 100 


FIG. 7 



WO 88/05440 


PCT/FR88/00025 


32/35 


FIG . 8 


( X.mac 
( versus 
( X . ROD 


**■ 


t « 



10 20 30 40 50 

MSDPRERIPPGNSGEETI GEAFEWUNRTVEEINREAVNHLPREL IFQVWQRSWEYHHDEO 




• « 4 « 

• • * 4 


« 

* 


« « # * 
« • « * 


« • « 
* * • 










MTOPRETVPPCNSCEETI CEAF AWLNRTVEA1NREAVNHI.PRELJFQVHOR5HRYHHOEO 


10 

20 

30 

40 

50 

70 

60 

90 

100 

110 


GHSQSYTKYRYLCLIQKALFHHCKKGCRCLGEGHGAGGWRPGPPPPPPPGLA 


4 « 

* ♦ 




* * # 
* * • 


* « 
* • 


« « « 
• * * 


* « 


* .4 * 


« « « • 
4 4 « 4 




4 4 
• 4 


GM5ESYTKYRYLCIIQKAVYMHVRKGCTCLGRCHGPCGWRPCPPPPPPPGLV 

70 80 90 100 110 



WO 88/05440 


PCT/FR88/00025 


33/35 


( F.mac 

F IG . 9 ( versus 
( F . ROD 


* 

« 




10 20 30 40 SO 

HGGAI SKKRSKPPEI CD-R DSCGRV CRN YGRLFK-GV EDGSSOSLGCLDKGLSSLSC EGO 
:: :::::: : s: : :i : ::::: 

MGASCSKKHSRPPRGLQERLIRARAGACGGYHNESGGEYSRFQE— GSDRE0KSP5CEGR 

10 20 30 40 SO 


60 70 80 00 100 110 

KYNOGEYHNTPWRNPAEERKKLPYRKQN1DOIOEEDODLVCIPVEARVPLRTMSYKLAIO 


to • to 


to • ■ to to to . • • ♦ «to to 

to« * to to • • «« * to to 


• * to 


• toto • • to to to 

• to • to tototo# 


0Y0QGDFflNTPWKDPAAEREKNLYRQQNM00VD5DDD0QVRVSVTPKVPl.RPHTHRl.AID 
60 70 80 90 100 110 


120 130 ' 140 150 160 170 

MSHFIKEKGGLEGIYYSARRHRILDIYLEKEEG1IPDHQI— -HSGPGIRYLKHFGWLWKL 

• « to • to • • to to to to • • • to to* ••#««*••** to' to « « • to to to • ! ! J ! 1 ! ! 

to to * to* to * to # to toto to to • to* •«#•«**«#* >**• to toto# to* 

HSHLIKTRGGLEGflFYSERRHKILNIYLEKEEGIIADWQNYTH-CP GVRYPflFFGWLMKL 
120 130 140 150 160 170 


180 190 200 210 220 230 

IPVNVSOEAOEDEEHYLVHPAQTSQHOOPWGEYLAHKFDPTLAYTYEAYIRYPEEFGSKS 


to to * to 
to to « * 


to to to 
« « to 


to « 


to # * 


« to 


* to to 


to to • 


• to 


VP V0VP06GEDTETHCLVHP AQTSKFDDPHGETLYWEFDPLLAYSYEAFIRYPEEFGHKS 
180 190 200 210 “ 220 230 


240 250 260 

GLSEKEVKRRLAARGLLEftADRKETS 


GLPEEEWXARLKARG IPFS 
240 250 


is 




FIG. 9 



WO 88/05440 


PCT/FR88/00025 


34/35 

( TaT . mac 
F I G . 1 0 ( versus 

( TAT. ROD 


10 20 30 40 50 

METPLREQEN5LES$NERSSY1$EAAAAIPESAM.GEEILSQLYRPLEACYNTCYCKKCC 


::::: ::::::::: : : : i :::: :: 

KETPLKAPE5SLKSCNEPFSRTS EGDVATQELARQCEEILSGtYRPLET CNNSCYCKRCC 


10 

20 

30 

AO 

50 

70 

80 

90 

100 

110 


YHCOFCF LKKGLGI SYEKSHRRRRTPKKAKANTS SASNERP— - IPNRI RLCOPKKAKKE 

««#*# ** **++++*** * * f * * • j * 

YHCQMCFINKCLG1CYERKGRRRRTPKKTKTHPSPT POKS 1ST RT COSO PTKKQKK 

70 ao 90., 100 110 


120 130 

TYEAAVATAPGLCR. 

* • • i 4 * 4 44 

• 4 » 4 4% 

tveatvetotgpcr 

120 130 



WO 88/05440 


PCT/FR88/00025 


i 


35/35 

( ART. mac 
F I G . 1 1 ( versus 

< ART. ROD 


10 20 30 AO 50 

MRSHTGEEELRRRLRLIHUHQTSKYGLSWKSAAYRHLLVDPYPTCSGSANQRRQKRRRW 


+ » ft • ♦ * ft * * 4 * 4 ** 

X « « 4 * * 4 4 « ft ft ft ft ft 

ttNERADEEGLORKLRU IRLLHOTN 

10 20 


■ 4 i 4 • 4 > 4 

4 4 1 4 ft 4 f» 4 


• • 


: : : : 


PYPOGPGTASQRRNRRRRH 
30 AO 


- 70 SO. 90 100 110 

RORWQOLLALAORI YSF.PbPPTDTPLDLAIOQLONLA IE5 IPOPPTNIPEALCDLRRIRR 


ft 4 
ft * 


4 4 * V ft ft 

• ft ft ft * ft 


ft ft ft 

• ft ft 


ft * 
ft 4 


ft ft 4 4 

ft * ft * 


ft ft ft ft 
ft ft ft ft 


ft « 
ft ft 


KQRWROILALAOSt YTf POPPAOSPLOQT IQHLQGLT IOELPDPPTHLPESORLAET 

50 60 70 80 90 100 


SPQA 


FIG. 11 



cv 


INTERNATIONAL SEARCH REPORT 

International Application No 


PCT/FR 88/00025 


k CLASSIFICATION OF SUBJECT MATTER several cfaaslflcatton symbols apply. Indicate all) s 

According to International Patent Classification (JPC) or to both National Classification and (PC 

4 C 07 K 7/10, 7/06, C 12 N 15/00, G 01 N 33/569, 
Int. Cl. : a 61 K 39/21, A 61 K 37/02 


II, FIELDS SEARCHED 


Minimum Documentation Searched f 


Classification System 


Classification Symbols 


Int. Cl. 


A 61 K 39/00, A 61 K 37/00, C 07 K 7/00, 
G 01 N 33/00, C 12 N 15/00 


Documentation Searched other then Minimum Documentation 
to the Extent that such Documents are Included In the Fields Searched * 


* t 
* * 


HI. DOCUMENTS CONSIDERED TO BE RELEVANT* 


Category 


Citation of Document, ” with indication, where appropriate, of the relevant passages 12 


X,Y 


X , Y 


X 


WO, A, 86/02383 (PASTEUR) 24 April 1986, see 
pages 21-34, 55-60; claims 1-16 

US, A, 4629783 (W.L. COS ANT) 16 December 

1986, see columns 15,16; claims 1-42 

* 

EP, A, 0199301 (HOFFMANN-LA ROCHE & CO.) 

29 October 1986, see columns 27-42; .claims 
1-42 

4 

EP, A, 0187041 (GENENTECH) 9 July 1986, see 
pages *79-81, claims 1-18; pages 82,83, claims 
24-38 

Science, vol . 232, 1985, American Association 
for the Advancement of Science, (Washington, 
DC, US) P.J. Kanki et al.: "New human 
T-lymphotropic retrovirus related to simian 
T-lymphotropic virus type III { STLV~III A g M ) 
pages 238-243 see the whole document 

Science, vol. 233, 18 July 1986, American 


Relevant to Claim No . 13 


1-36 


1-36 


i 1,2,6-12,14 
! 21,24 ' 


1 -,2,6-12, 14 
21,24 


1-36 


l*-36 


* Special categories of Cited documents: 

"A" document defining the general state of the art which (a not 
considered to be ol particular relevance 

"E" earlier document but published on or after the international 
fifing date 

H L” document which may throw doubts on priority clalm(a) or 
which 1$ cited to establish the publication date of another 
citation or other special reason (as specified) 

"O" document referring to an oral disclosure, use, exhibition or 
other means 

“P” document published prior to the International filing date but 
later than the priority date claimed 

U T‘ later document published after the international filing date 
or priority date and not in conflict with the application but 
cited to understand the principle or theory underlying the 
Invention 

“X” document of particular relevance; the claimed invention 
cannot be considered novel or cannot be considered to 
involve an inventive step 

”Y” document of particular relevance;' the claimed Invention 
cannot be considered to Involve an inventive step when the 
document is combined with one or more other such docu- 
ments, such combination being obvious to a person skilled 
In the art 

document member of the same patent family 

IV. CERTIFICATION 


Date of the Actual Completion of the International Search 

Date of Mailing of this International Search Report 

10 June 1986 (10.06.86) 

7 July 1988 (07.07.88) 

International Searching Authority 

EUROPEAN PATENT OFFICE 

Signature of Authorized Officer 


Form PCT/iSA/210 /second sheet) (January 1685) 


International Application No. pCT/FR 88/00025 


] 111. DOCUMENTS CONSIDERED TO SE RELEVANT (CONTINUED FROM THE SECOND SHEET) 

Cat* 9 ory * 

| Citation of Document, wrtth Indication, wtiara appropriate, of the relevant ptsaages 

Raiavant to Claim No 


(Washington, DC, US) F. Clavel et al . : 
“Isolation of a new human retrovirus from 
West African patients with AIDS", pages 
343-346 see the whole document 


Y 

Nature, vol. 324, 18/25 December 1986, 
MacMillan Eds. (Londres, GB) F. Clavel et al. : 
"Molecular cloning and polymorphism of the 
human immune deficiency virus type 2", pages 
691-695 see the whole document 

1-36 

Y 

Nature, vol. 321, 22 May 1986 MacMillan Eds. 
(Londres, GB) M. Murphey-Corb et al . : 
"Isolation of an HTLV-III-related retrovirus 
from macaques with simian AIDS and its 
possible origin in asymptomatic mangabeys" , 
pages 435-437 see the whole document 

1-36 

P,X 

* # 

WO, A, 87/02038 (ONCOGEN) 9 April 1987, 
see pages 114-117; claims 31-55 

1,2,6-12,14- 

21,24 

P,X 

Journal of Cellular Biochemistry, Supplement 
1ID, Ucla Symposia on Molecular & Cellular 
Biology, 29 March - 1 May 1987, Symposium on 
human retroviruses, 16th Annual Meeting 
UCLA, see page 44, abstract P112: "Human 
retroviruses, cancer and AIDS: approaches to 
prevention and therapy" 

% * 

1-36 

% 

P,Y 

FR, A, 2593189 (PASTEUR) 24 July 1987, see 
page 8, lines 17-26; pages 13-15, claims 
1-18 

1-36 

P,Y 

Nature, vol. 326, No. 6113, 9-15 April 1987, 
MacMillan Eds. (Londres, GB) H. Kornfeld 
et al . : "Cloning of HTLV-4 and its relation 
to simian and human immunodeficiency viruses" 
pages 610-613, see the whole document 

1-36 

P , Y 

Nature, vol. 326, 16 April 1987, MacMillan 
Eds . ( Londres , GB ) M . Guyader et al . : 
"Genome organization and trans activation of 
the humen immunodef iciency virus type 2 , 
pages 662-669, see the whole document 

1-36 

D 

P t Y 

FEBS Letters, vol, 218, No. 2, June 1987, 
Eds. Elsevier Siencc Publishers B.V. 
(Biomedical Division), 1987 Federation of 
European Biochemical Societies M.J.E. 
Sternberg et al.: "Prediction of antigenic 
determinants and secondary structures of the 
major AIDS virus proteins", pages 231-237 

1-36 


Form PCT/ISA/S10 (extra tiitat) (January 1985) 



r 


International Application Mo. P CT / FR 88/00025 


FURTHER INFORMATION CONTINUED FROM THE SECOND SHEET 


* 


see the whole document 


V.Q OBSERVATIONS WHERE CERTAIN CLAIMS WERE FOUND UNSEARCHABLE 1 

TM« International search report has not been established In respect of certain claims under Article 17(2) (a) for the following reasons: 
t.( [ Claim numbers because they refate to subfect matter not required to be searched by this Authority, namely: 


*□ Claim numbers. because they relate to parts of the International application that do not comply with the prescribed require- 

merits to such an extent that no meaningful International search can be carried out specifically: 


3 ] ) claim numbers because they are dependent claims and we not drafted In accordance wtth the second and third sentences of 

PCT Rule 8.44a). 


VI.Q OBSERVATIONS WHERE UNITY OF INVENTION IS LACKING 2 


This International Searching Authority found multiple Inventions In this International application as follows: 


Claims 

Claims 

Claims 


1 , 2,6 

1 , 2,6 

23,25 


21,23 

21,23 

28,34 


-36 

-36 all in. part 3-5 
-36 all in part 22,24,29 


t.pn As all required additional search fees were timely paid by the applicant; this International search report covers ell searchable claims 
of the International application. 

2.n As only some of the required additional search fees were timely paid by fhe applicant, this International search report covert only 
those claims of the International application for which fees were paid, specifically claims: 


3>| } No required additional search fees were timely paid by the applicant Consequently, this international search report f* restricted to 
the Invention first mentioned in the claims; It Is covered by claim numbers; 


4.| [ At all searchable claim* could be searched without effort justifying an additional' fee, the International Searching Authority did not 
— } Invite payment ot any additional fee. * 

Remark on Protest 

n The additional search tees wers accompanied by applicant's protest 
fif) No protest accompanied the payment of additional March feet. 


Form PCT/1SA/210 {supplemental sheet (2)) {January 1 995) 


fcTO n>RM F0419 


» 


* 


ANNEX TO THE INTERNATIONAL SEARCH REPORT 
ON INTERNATIONAL PATENT APPLICATION NO. FR 8800025 

SA 20445 

This annex lists the patent family members relating to the patent documents cited in the above-mentioned international search report. 
The members are as contained in the European Patent Office EDP file on 23/06/S& 

The European Patent Office is in no way liable for these particulars which are merely given for the purpose of information. 


Patent document 
cited in search report 

Publication 

date 

Patent family 
membcr(s) 

Publication 

date 

• 

WO-A- 8602383 

24-04-86 

FR-A- 

2571968 

25-04-86 



AU-A- 

5061785 

02-05-86 



EP-A- 

0201540 

20-11-86 

* 

- 

JP-T- 

62500592 

12-03-87 



W0-A- 

8604336 

31-07-86 



AU-A- 

5320086 

13-08-86 


■ 

EP-A- 

0211022 

25-02-87 


• 

• 

JP-T- 

62502095 

20-08-87 

US-A- 4629783 

16-12-86 

EP-A- 

0201716 

20-11-86 



WO-A- 

8606414 

06-11-86 


4 

AU-A- 

5572786 

16-10-86 



AU-A- 

5773386 

18-11-86 



EP-A- 

0220273 

06-05-87 



JP-T- 

62502617 

08-10-87 


' . ^ : .v ■ 

AU-8- 

571128 

31-03-88 

EP-A- 0199301 

29-10-86 

AU-A- 

5636386 

23-10-86 



JP-A- 

62012799 

21-01-87 

EP-A- 0187041 

09-07-86 

JP-A- 

61233700 

17-10-86 

W0-A- 8702038 

09-04-87 

AU-A- 

6299286 

09-04-87 


- 

BE-A- 

905492 

25-03-87 



G8-A- 

2181435 

23-04-87 



FR-A- 

2587720 

27-03-87 



5E-A- 

8604007 

26-03-87 


rf ■ % 

NL-A- 

8602422 

16-04-87 

- 

* 

FR-A- 

2593519 

31-07-87 

h 


JP-A- 

63068075 

26-03-88 

FR-A- 2593189 

24-07-87 

W0-A- 

8704459 

30-07-87 



AU-A- 

6891187 

14-08-87 

- 


EP-A- 

0239425 

30-09-87 

t 




* 



$ 




For more details about this annex : see Official Journal of the European Patent Office, No. 12/82 


RAPPORT OE RECHERCHE INTERNATIONALE 

PCT/FR 88/00025 


Demand* international# N* 


I CLASSCMCNT OE L'fNVENTIOH ($i pliisitfufj #ymbotos da clifiwfiMtwfl sont applicable** les indtqvef tous) r 


S«lcm fa el*«»fi«at>on international* d*> brevats (CIS) ou h la fofs selon la classification national* «t la CI8 

4 C 07 K 7/10, 7/06, C 12 N 15/00, G 01 N 33/569, 
CIB 1 A 61 K 39/21, A 61 K 37/02 



CIB 


A 61 K 39/00, A 61 K 37/00, C 07 K 7/00, 
G 01 N 33/00, C 12 N 15/00 

Documentation consults autre qua la documentation minimal* dans la mesur* 
e (t da tali doeumanta font parti* d*i domaine* »ur lesouals la recherche « port* * 


III. DOCUMENTS CONSIOErES COMMC PERTINENTS » 


Catftgoria • 

Identification des documents eit*s,” avec indication, si ndeessaire, 

des passages pertinents 11 

N* des revendications 

vis*es '» 

X,Y 

WO, A, 86/02383 (PASTEUR) 24 avril 1986, 
voir pages 21*34, 55*60; revendications 
1-16 

1-36 


X,Y US, 

f 

*« a 

X . EP, 


A, 4629783 (W.L. COSANT) 16 decembre 
1986, voir colonnes 15,16; revendications 

1-42 


1-36 


A, 0199301 (HOFFMANN-LA ROCHE & CO.) 
29 octobre 1986, voir colonnes 27-42; 
revendications 1-42 


lr2,6-12, 

14-21,24 



EP, A, 0187041 (GENENTECH) 9 juillet 1986, 
voir pages 79-81, revendications 1-18? 
pages 82,83, revendications 24-38 


1 , 2 , 6 - 12 , 

14-21,24 



Science, vol. 232, 1985, American Associatior 
for the Advancement of Science, 
(Washington, DC, US) P.J. Kanki et al.s 
"New human T-lympho tropic retrovirus 
related to simian T-lymphotropic virus 
type III (STLV-III AGM ) 


1-36 


* Categories sp*ciales d* document* cit*s: M 

a A » document d*finissant f**tat g*n*ral da la technique non 
consider* comma partlculi*rement partmant 


a T a documant ultirteur publi* posttrieurement * la data d* dtpdt 
International ou * la data da prionta at n'Bppertenant pat 
il’iUtdaia technique pertinent, mait cil* pour cpmprandro 
la priftcip* ou la thdone conatituant la bat* d* (’invention 




a E » documant anttriaur, malt oubti* a la data da depot interna- 
tional ou apr*a catta date 

« L 3 document pouvant jater un doutt tur una revandleatlon da 
priority ou cit* pour determiner ia date oe publication d’un* 
autra citation ou pour una raiton apdciala (telle qu'indiqw*e| 

« O » documant it rdttranl * un* divulgation oral*, * un ussge, * 
una exposition ou toua autre t moans 

« P » documant pubtf* avant la data da d*pdt International, mala 
posttrieurement A la date da priori** revandiqu*a 


a X a documant partieull*rement partinant: (’Invention revendi- 
qu*a n* paut *tra coneid*r*a comma nouvelle ou comma 
impliquant una activtt* inventive 

«Y* documant particuii*ramant partinant; (Invention raven* 
diou*a na paut *tra eonatd*r*a comma impliquant un* 
activit* invent!*# lortoue la documant eat assod* * un ou 
piueieurs autra* doeumanta da m*me nature, cett* combi* 
naiton Slant Svidante pour una partonna du m*tier. 

* A a documant qul fait parti* da la m*ma famiiia da brevets 


IV. CERTIFICATION 

Oat* i laquelle la recherche international# a *t* eflectlvement 
schevda 

10 juin 1986 


Administration charge# da la rtcharcha international# 

' OFFICE EUROPEEN DES BREVETS 


Date d'exp*tf itlon du present rapport d* recherche international* 



-7JJJL 1988 


Formuiaira PCTfl5Aff1Q (d*uzi*ma fertile) (Janvier 18*5) 



D«mandt International# N* PCT / FK 88/00025 


til. OOCUMENTS COMSIOERES COMME PeHTIHtHTS 


(SUITE DCS RENSEIONEMEHTS INOlQuES SUR LA 
OEUXltMC FEUtLLE) 


Cattoori** 


ioantmeation ow documents di*#, ine Indtcation, ai n0ea#safr», 

Om paaaagvt parti rwita 


N» Ow ravwicatlont 

vta4aa 


P,X 


P,X 




B,Y 


P,Y 


pages 238-243 

voir le document en entier 

Science, vol. 233, 18 juillet 1986, 

American Association for the Advancement 
of Science, (Washington, DC, US) 

F. Clavel et al.: "Isolation of a new 
human retrovirus from West African 
patients with AIDS", pages 343-346 
voir le document en entier 

Nature, vol. 324, 18/25 decembre 1986, 
MacMillan Eds. (Londres, GB) 

F. Clavel et al. : "Molecular cloning 
and polymorphism, of the human immune 
deficiency virus type 2", pages 691-695 
voir le document en entier 

j 

Nature, vol. 321, 22 mai 1986, 

MacMillan Eds. (Londres, GB) 

M. Murphey-Corb et al.: "Isolation of 
* aiiHTLV-III-r elated retrovirus from 
macaques with simian AIDS and its 
possible origin in asymptomatic 
mangabeys", pages 435-437 
voir le document en entier 

WO, A, 87/02038 (ONCOGEN) 9 avril 1987, 
voir apges 114-117; revendicaions 
31-55 

Journal of Cellular Biochemistry, Supplement 
11D, Ucla Symposia on Molecular & 
Cellular Biology, 29 mars - 1 mai 1987, 
Symposium on human retroviruses, 

16th Annual Meeting UCLA, 
voir page 44, abrege P112: 

"Human retroviruses, cancer and AIDS: 
approaches to prevention and therapy" 

FR, A, 2593189 (PASTEUR) 24 juillet 1987, 
voir page 8, lignes 17-26; pages 13-15, 
revendications 1-18 

Nature, vol. 326, no. 6113, 9-15 avril 1987, 
MacMillan Eds . ( Londres , GB ) 

H. Kornfeld et al.: "Cloning of HTLV-4 

and its relation to simian and human 

immunodeficiency viruses" 

pages 610-613, 

voir le document en entier 


k.*. ». 


1-36 


1-36 


1-36 


1,2,6-12, 

14-21,24 


1-36 


1-36 


1-36 


Formula! r* PCT/13A/210 (f#uil|# addJtfenn#!!#) (Jtnvttt 1 MS) 



Dwrund* iflfertiitiQflif* n* pCT / FR 88/00025 "3* 


4 

* 


# 


> 


* 

t 





Damanda intarnationala N* PCT/FR 88/00025 


SUITE DCS RENSEIGNCMEKTS INOIQUES EUR LA BCUXIEME FEUILLE 



V OBSERVATIONS LORSQU'IL A fiTt ESTWE QUE CERTAINES R6VENDICATIONS NE POUVA1ENT PAS FAIRE 
L'OBJET D'VJNE RECHERCHE 1 


Salon 1’articla 173) a) eartalnaa ravandrcationt n'ont pat fait 1'obiat d'una racharcha pour It* motifa auhanta; 

1 , n tat rtwndfcationa num*roa at rapportant i un objtt 4 I’ipard duqutl )« pri*antt administration n'a pat I'obllQtlfon d« pro- 

1 — 1 c*dtr I (a r a cft tr cft t. t aavotr : 


2, □ La* rtnhdtcatfon* numtrot™. «* rapportcnt'i das partita da 1* damanda intamationilt quf nt rampHaaant pat las conditions 

preterit** dans una tnatura tatfa qu'una racharcftt aipnificative nc paut ttra affcctuda* pr*ci**mant: 


3 , lm nwandteatfon* numarot aont dn wandfcationa dtpandanit* at na font pat r*dig*tt confofm4nwrt 4 ladauxiftmaat * ft troirttnt 

‘ pnrataa da it r*$(* du PCT, 


VI. OBSERVATIONS LORSQU'IL Y A ABSENCE D'UNITE OE L'lNVENTlON * 


L'admfntitratlan eharpdt da la racharcftt international# a trouv* plutiaurt invantiona dan* la prtaanta damanda irrttmalionnfe, c‘aat-i*dlre: 

Revendications 1,2,6-21,23-36 

Revendications 1,2,6-21,23-36 toutes partiellement 3-5 
Revendications 23,25-28,34-36 toutes partiellement 22,24,29 

* 

t.^T Comma taut#* taa turn* addltlonnaUat demand*** ant 4t4 pay *#■ dans las diiafa, la priaant rapport da racharcha International* 
aouvrt toutaa let ravandications da It damanda intarnationala pouvant lairs l'ebjat d'vna racharcha. 

2. n Comma aauitmtnt una partfa daa taxaa iddiitonnaii#* demand*## a *t* pay*# dan* la* d*tala, la pr**#ni rapport da raeftareMlntafnatlonal# 
couvTt sauttmam ctiiat dat wandiwtton* da (t damanda poor NtpiMifat taa taxaa ont at* pcytaa . c att**-<JJra m rawndteattons : 


3. Q Aucuna tan ad dltfonnallt damand«a n'a *t* pay** dan* las d*Ial*'par la d*poaant En constqutnca, la prtaant rapport dt raeftarcha 
intamatfontfa att limit* * f’invantton mantionn*a an pramiar dans las revindications; alia cat couvert* par laa revindications 
numtroa: 


4. | I Etant donit* qua toulat laa ravandleatfona auacaptlblas da falra i'objat d'una raeftarcha la pouvalant aana effort parlieulitr jimifiant 
UJ una tail additlonntUa, i'admlniauabon chirp*# da la raeftarcha mtamatiantla n’a toflicit* la patamant d’aucuna tax* addldonnalia. 

Ramarqua quant 4 la rtsarvt 

Q Laa taxes addltlonnaUat da raeftarcha *taiant tceompapn*ta d'una rtaarva du d*peunt 
^ Aucuna risarvt n'a *t* fail# lora du palamant daa tax#* adddionnallaa da raeftarcha. 
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ANNEXE AU RAPPORT DE RECHERCHE INTERNATIONALE 
RELATIF A LA DEMANDE INTERNATIONALE NO. FR 8800025 

SA 20445 

La presente annexe indique les membres de ia famille de brevets relatifs aux documents brevets cites dans le rapport de 
recherche international vise ci-dcssus. 

Lcsdits members sent contenus au fichier itiformatique de ("Office europeen dcs brevets a la date du 23/06/S8 

Les renseignements foumis sont defines a litre indicatif et n'engagent pas la respoosabilite de 1'Office europeen des brevets. 



Pour tout renseignement conceraant cette annexe t voir Journal 


de t'Office europeen des brevets. No. 12/82 





